Regla Empirica-Teorema de Chebyshev

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 14

Regla empírica y teorema

de Chebyshev
Coeficiente de variación
Hemos visto que las medidas de centralización y dispersión nos dan
información sobre una muestra. Nos podemos preguntar si tiene
sentido usar estas magnitudes para comparar dos poblaciones.

Por ejemplo: si nos piden comparar la dispersión de los pesos de las


poblaciones de elefantes de dos circos diferentes, la desviación
estándar (𝑠) nos dará información útil. ¿Pero qué ocurre si lo que
comparamos es la altura de
x unos elefantes con respecto a su peso?
Tanto la media como la desviación típica, ( 𝑥 y s), se expresan
X
en las
mismas unidades que la variable. Por ejemplo, en la variable altura
podemos usar como unidad de longitud el metro y en la variable peso,
el kilogramo. Comparar una desviación (con respecto a la media)
medida en metros con otra en kilogramos no tiene ningún sentido.
El problema no se resuelve tomando las mismas escalas para ambas
poblaciones. Por ejemplo, se nos puede ocurrir medir a las hormigas con
las mismas unidades que los elefantes (toneladas). Si la ingeniería
genética no nos sorprende con alguna barbaridad, lo lógico es que la
dispersión de la variable peso de las hormigas sea prácticamente nula
(¡Aunque haya algunas que sean 1.000 veces mayores que otras)

En los dos primeros casos mencionados anteriormente, el problema viene


de la dimensionalidad de las variables, y en el tercero de la diferencia
enorme entre las medias de ambas poblaciones. El coeficiente de
variación es lo que nos permite evitar estos problemas, pues elimina la
dimensionalidad de las variables y tiene en cuenta la proporción existente
entre medias y desviación típica. Se define del siguiente modo:

𝑠𝑥
𝑐𝑣 =
𝑥
Propiedades del coeficiente de variación
• Sólo se debe calcular para variables con todos los valores positivos.

• Todo índice de variabilidad es esencialmente no negativo. Las


observaciones pueden ser positivas o nulas, pero su variabilidad debe ser
siempre positiva. De ahí que sólo debemos trabajar con variables positivas,
para la que tenemos con seguridad que x > 0.

• No es invariante ante cambios de origen. Es decir, si a los resultados de una


medida le sumamos una cantidad positiva, b > 0, para tener Y = X + b,
entonces CVY < CVX.

• Es invariante a cambios de escala. Así por ejemplo el coeficiente de


variación de una variable medida en metros es una cantidad adimensional
que no cambia si la medición se realiza en centímetros.
Ejemplos
1. En marzo del año pasado, los datos de préstamos personales de
un Banco mostraron un promedio de $6500000 y una desviación
estándar de $ 3000000. Recientemente se calculó la media y la
desviación estándar correspondiente a los préstamos personales
de marzo del presente año resultando las mismas $9000000 y
$3500000 respectivamente. ¿En cuál de los dos años los
préstamos personales presentaron menor dispersión relativa?
2. En un grupo A, de personas, la estatura media es 165 cm, con un
a desviación típica de 10,5 cm. En otro grupo, B, la estatura
media es 140 cm y su desviación típica, 8,4 cm. Calcula el
coeficiente de variación en los dos casos y compara la dispersión
de ambos grupos.
3. El tiempo medio empleado por el tren en recorrer un cierto
trayecto es de 25 minutos, con una desviación típica de 5
minutos. Haciendo el mismo trayecto en coche, el tiempo medio
ha sido de 35 minutos, con una desviación típica de 15 minutos.
Calcula el coeficiente de variación y di en cuál de los dos casos
hay mayor variación relativa.
4. Midiendo el tiempo en minutos que han tardado los
participantes de una carrera en llegar a la meta, hemos
obtenido los siguientes resultados.
1. Calcula el tiempo medio empleado por los corredores y la
desviación típica.
2. En cuanto al tiempo empleado en la carrera, ¿es un grupo
homogéneo o es disperso?
• Tipificación.- Se conoce por tipificación al proceso de restar la media
y dividir por su desviación típica a una variable X. De este modo se
obtiene una nueva variable

𝑥− 𝑥
𝑧=
𝑠

de media 𝑥𝑧 = 0 y desviación estándar 𝑠𝑧 = 1, que denominamos


variable tipificada.

• Esta nueva variable carece de unidades y permite hacer comparables


dos medidas que en un principio no lo son. Así por ejemplo nos
podemos preguntar si un elefante es más grueso que una hormiga
determinada, cada uno en relación a su población. También es
aplicable al caso en que se quieran comparar individuos semejantes
de poblaciones diferentes.
Ejemplos:
Si deseamos comparar el nivel académico de dos estudiantes de
diferentes Universidades para la concesión de una beca de estudios,
en principio sería injusto concederla directamente al que posea una
nota media más elevada, ya que la dificultad para conseguir una buena
calificación puede ser mucho mayor en un centro que en el otro, lo
que limita las posibilidades de uno de los estudiante y favorece al otro.
En este caso, lo más correcto es comparar las calificaciones de ambos
estudiantes, pero tipificadas cada una de ellas por las medias y
desviaciones típicas respectivas de las notas de los alumnos de cada
Universidad.
1. La temperatura durante septiembre está distribuida normalmente
con media 18,7ºC y desviación estandar 5ºC. Calcule la
probabilidad de que la temperatura durante septiembre esté por
debajo de 21ºC.
No confundir coeficiente de variación y tipificación

• Los coeficientes de variación sirven para comparar las variabilidades de


dos conjuntos de valores (muestras o poblaciones), mientras que si
deseamos comparar a dos individuos de cada uno de esos conjuntos, es
necesario usar los valores tipificados. Ninguno de ellos posee unidades y
es un error frecuente entre estudiantes de bioestadística confundirlos.
Distribución de datos
Regla empírica
Si un conjunto de datos se distribuye, aproximadamente, en forma de campana es
posible aplicar en ellos la llamada, regla empirica.
Esta regla permite encontrar el porcentaje de datos que debe estar dentro de
determinadas desviaciones estándar respecto a la media. A continuación se
determinan estos porcentajes:

• Aproximadamente el 68% de los datos están a mas menos ( + ) de una desviación


estándar de la media
• Aproximadamente el 95% de los datos están a mas menos ( + ) de dos desviaciones
estándar de la media
• Casi todos los datos de la muestra están a mas menos ( + ) tres desviaciones de la
media

La regla empírica es el resultado de la experiencia práctica de investigadores en


muchas disciplinas, que han observado muy diferentes tipos de conjuntos de datos de
la vida real
Teorema de Chebyshev
Independientemente de la forma de la distribución de los datos, Chebyshev
demostró que:

1. Por lo menos 75% de los datos están en el intervalo de la media mas


menos dos desviaciones estándar
2. Por lo menos, el 89% de los datos están en el intervalo de la media mas
menos tres desviaciones estándar

Sea k > 1 para cualquier conjunto de datos, la proporción de los valores que
1
están comprendidos entre 𝑥 ± 𝑘𝑠 es por lo menos de 𝑝 = 1 − 2. En donde 𝑘
𝑘
es un número positivo, es decir nos da la probabilidad mínima de que la
variable aleatoria tome valores a k desviaciones estándar del valor esperado.
Ejemplo: Con los valores dela siguiente tabla de distribución de frecuencias:

X Frecuencia
5 3
8 7
10 4
12 5
17 3
20 2

Identifique los intervalos de la distribución de los datos con respecto a la


media, con sus respectivas probabilidad. Tanto con la regla empírica y
mediante el teorema de Chebyshev.

También podría gustarte