1.4 Medidas de Variacion

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 5

2.4.

MEDIDAS DE VARIABILIDAD O DISPERSION 55

3 n/4 Ni1 37, 5 35


Q3 = li1 + ai = 7 + 5 = 9, 5
ni 5

2.4. Medidas de variabilidad o dispersi


on
Los estadsticos de tendencia central o posici
on nos indican donde se
sit
ua un grupo de puntuaciones. Los de variabilidad o dispersi on nos indican
si esas puntuaciones o valores estan proximas entre s o si por el contrario
estan o muy dispersas.

2.4.1. Rango

Una medida razonable de la variabilidad podra ser la amplitud o ran-


go, que se obtiene restando el valor mas bajo de un conjunto de observa-
ciones del valor mas alto.

Propiedades del rango

Es facil de calcular y sus unidades son las mismas que las de la varia-
ble.
No utiliza todas las observaciones (solo dos de ellas);
Se puede ver muy afectada por alguna observacion extrema;
El rango aumenta con el n umero de observaciones, o bien se queda
igual. En cualquier caso nunca disminuye.

2.4.2. Varianza

La varianza, S 2 , se define como la media de las diferencias cuadraticas


de n puntuaciones con respecto a su media aritmetica, es decir
n
2 1X
S = (xi x)2 (2.7)
n i=1
56 Bioestadstica: Metodos y Aplicaciones

Esta medida es siempre una cantidad positiva, con propiedades intere-


sante para la realizacion de inferencia estadstica. Como sus unidades son
las del cuadrado de la variable, es mas sencillo usar su raz cuadrada, que
es la que vemos en la siguiente seccion.

2.4.3. Desviaci
on tpica o est
andar

La varianza no tiene la misma magnitud que las observaciones (ej. si las


observaciones se miden en metros, la varianza lo hace en metros cuadrados.
Si queremos que la medida de dispersion sea de la misma dimensionalidad
que las observaciones bastara con tomar su raz cuadrada. Por ello se define
la desviacion tpica, S, como

S= S2

2.4.4. Ejemplo de c
alculo de medidas de dispersi
on

Calcular el rango, varianza y desviacion tpica de las siguientes canti-


dades medidas en metros:

3, 3, 4, 4, 5

Solucion: El rango de esas observaciones es la diferencia entre la mayor


y menor de ellas, es decir, 5 3 = 2. Para calcular las restantes medidas de
dispersion es necesario calcular previamente el valor con respecto al cual

vamos a medir las diferencias. Este es la media:

x = (3 + 3 + 4 + 4 + 5)/5 = 3, 8 metros

La varianza es:
n
1X
2 1 2 
S = x2i x2 = 3 + 32 + 42 + 42 + 52 3, 82 = 0, 56 metros2
n i=1 5

siendo la desviacion tpica su raz cuadrada:


p
S= S2 = 0, 56 = 0, 748 metros

2.4. MEDIDAS DE VARIABILIDAD O DISPERSION 57

Propiedades de la varianza y desviacion tpica

Ambas son sensibles a la variacion de cada una de las puntuaciones,


es decir, si una puntuacion cambia, cambia con ella la varianza. La
razon es que si miramos su definicion, la varianza es funcion de cada
una de las puntuaciones.
La desviaci
on tpica tiene la propiedad de que en el intervalo
def
(x 2 S, x + 2 S) x 2 S

se encuentra, al menos, el 75 % de las observaciones Incluso si tene-


mos muchos datos y estos provienen de una distribucion normal (se
definir
a este concepto m
as adelante), podremos llegar al 95 %.
No es recomendable el uso de ellas, cuando tampoco lo sea el de la
media como medida de tendencia central.

2.4.5. Coeficiente de variaci


on

Hemos visto que las medidas de centralizacion y dispersion nos dan infor-
macion sobre una muestra. Nos podemos preguntar si tiene sentido usar
estas magnitudes para comparar dos poblaciones. Por ejemplo, si nos piden
comparar la dispersion de los pesos de las poblaciones de elefantes de dos
circos diferentes, S nos dara informacion u
til.
Pero que ocurre si lo que comparamos es la altura de unos elefantes
con respecto a su peso? Tanto la media como la desviacion tpica, x y S,
se expresan en las mismas unidades que la variable. Por ejemplo, en la
variable altura podemos usar como unidad de longitud el metro y en la
variable peso, el kilogramo. Comparar una desviacion (con respecto a la
media) medida en metros con otra en kilogramos no tiene ning un sentido.
El problema no deriva solo de que una de las medidas sea de longitud y la
otra sea de masa. El mismo problema se plantea si medimos cierta cantidad,
por ejemplo la masa, de dos poblaciones, pero con distintas unidades. Este
es el caso en que comparamos el peso en toneladas de una poblacion de
100 elefantes con el correspondiente en miligramos de una poblacion de 50
hormigas.
58 Bioestadstica: Metodos y Aplicaciones

El problema no se resuelve tomando las mismas escalas para ambas


poblaciones. Por ejemplo, se nos puede ocurrir medir a las hormigas con las
mismas unidades que los elefantes (toneladas). Si la ingeriera genetica no
nos sorprende con alguna barbaridad, lo logico es que la dispersion de la
variable peso de las hormigas sea practicamente nula (Aunque haya algunas
que sean 1.000 veces mayores que otras!)
En los dos primeros casos mencionados anteriormente, el problema viene
de la dimensionalidad de las variables, y en el tercero de la diferencia enorme
entre las medias de ambas poblaciones. El coeficiente de variaci on es lo que
nos permite evitar estos problemas, pues elimina la dimensionalidad de las
variables y tiene en cuenta la proporcion existente entre medias y desviacion
tpica. Se define del siguiente modo:

SX
CV = (2.8)
x

Propiedades del coeficiente de variaci


on

Solo se debe calcular para variables con todos los valores positivos.
Todo ndice de variabilidad es esencialmente no negativo. Las ob-
servaciones pueden ser positivas o nulas, pero su variabilidad debe
ser siempre positiva. De ah que solo debemos trabajar con variables
positivas, para la que tenemos con seguridad que x > 0.

No es invariante ante cambios de origen. Es decir, si a los resultados


de una medida le sumamos una cantidad positiva, b > 0, para tener
Y = X + b, entonces CV Y < CV X .

Es invariante a cambios de escala. As por ejemplo el coeficiente de


variacion de una variable medida en metros es una cantidad adimen-
sional que no cambia si la medicion se realiza en centmetros.

Tipificaci
on

Se conoce por tipificaci on al proceso de restar la media y dividir por su


desviacion tpica a una variable X. De este modo se obtiene una nueva
2.5. ASIMETRIA Y APUNTAMIENTO 59

variable

X x
Z= (2.9)
S
de media z = 0 y desviacion tpica SZ = 1, que denominamos variable
tipificada.
Esta nueva variable carece de unidades y permite hacer comparables
dos medidas que en un principio no lo son. As por ejemplo nos podemos
preguntar si un elefante es mas grueso que una hormiga determinada, cada
uno en relacion a su poblacion. Tambien es aplicable al caso en que se quie-
ran comparar individuos semejantes de poblaciones diferentes. Por ejemplo
si deseamos comparar el nivel academico de dos estudiantes de diferentes
Universidades para la concesion de una beca de estudios, en principio sera
injusto concederla directamente al que posea una nota media mas elevada,
ya que la dificultad para conseguir una buena calificacion puede ser mucho
mayor en un centro que en el otro, lo que limita las posibilidades de uno de
los estudiante y favorece al otro. En este caso, lo mas correcto es comparar
las calificaciones de ambos estudiantes, pero tipificadas cada una de ellas
por las medias y desviaciones tpicas respectivas de las notas de los alumnos
de cada Universidad.

No confundir coeficiente de variaci


on y tipificaci
on

Los coefientes de variacion sirven para comparar las variabilidades de


dos conjuntos de valores (muestras o poblaciones), mientras que si deseamos
comparar a dos individuos de cada uno de esos conjuntos, es necesario
usar los valores tipificados. Ninguno de ellos posee unidades y es un error
frecuente entre estudiantes de bioestadstica confundirlos.

2.5. Asimetra y apuntamiento

Sabemos como calcular valores alrededor de los cuales se distribuyen las


observaciones de una variable sobre una muestra y sabemos como calcular
la dispersion que ofrecen los mismos con respecto al valor de central. Nos

También podría gustarte