Estadística Bidimensional
Estadística Bidimensional
Estadística Bidimensional
las representamos por el par (xi, yi). Si representamos cada par de valores como las coordenadas de un punto, el conjunto de todos ellos se llama nube de puntos o diagrama de dispersin. Sobre la nube de puntos puede trazarse una recta que se ajuste a ellos lo mejor posible, llamada recta de regresin. Ejemplo Las notas de 12 alumnos de una clase en Matemticas y Fsica son las siguientes: Matemticas 2 3 4 4 5 6 6 7 7 8 10 10 Fsica 1 3 2 4 4 4 6 4 6 7 9 10
Covarianza La covarianza de una variable bidimensional es la media aritmtica de los productos de las desviaciones de cada una de las variables respecto a sus medias respectivas. La covarianza se representa por sxy o xy.
La covarianza indica el sentido de la correlacin entre las variables Si xy >0 la correlacin es directa. Si xy <0 la correlacin es inversa. La covarianza presenta como inconveniente, el hecho de que su valor depende de la escala elegida para los ejes. Es decir, la covarianza variar si expresamos la altura en metros o en centmetros. Tambin variar si el dinero lo expresamos en euros o en dlares. Correlacin La correlacin determina la relacin o dependencia que existe entre las dos variables que intervienen en una distribucin bidimensional.
Es decir, determinar si los cambios en una de las variables influyen en los cambios de la otra. En caso de que suceda, diremos que las variables estn correlacionadas o que hay correlacin entre ellas.
Propiedades 1. El coeficiente de correlacin no vara al hacerlo la escala de medicin. Es decir, si expresamos la altura en metros o en centmetros el coeficiente de correlacin no vara. 2. El signo del coeficiente de correlacin es el mismo que el de la covarianza. Si la covarianza es positiva, la correlacin es directa. Si la covarianza es negativa, la correlacin es inversa. Si la covarianza es nula, no existe correlacin. 3. El coeficiente de correlacin lineal es un nmero real comprendido entre menos 1 y 1. 1 r 1 4. Si el coeficiente de correlacin lineal toma valores cercanos a 1 la correlacin es fuerte e inversa, y ser tanto ms fuerte cuanto ms se aproxime r a 1. 5. Si el coeficiente de correlacin lineal toma valores cercanos a 1 la correlacin es fuerte y directa, y ser tanto ms fuerte cuanto ms se aproxime r a 1. 6. Si el coeficiente de correlacin lineal toma valores cercanos a 0, la correlacin es dbil. 7. Si r = 1 1, los puntos de la nube estn sobre la recta creciente o decreciente. Entre ambas variables hay dependencia funcional. Diagramas de dispersin 1 Correlacin directa La recta correspondiente a la nube de puntos de la distribucin es una recta creciente.
2 Correlacin inversa La recta correspondiente a la nube de puntos de la distribucin es una recta decreciente.
3 Correlacin nula En este caso se dice que las variables son incorreladas y la nube de puntos tiene una forma redondeada.
Grado de correlacin El grado de correlacin indica la proximidad que hay entre los puntos de la nube de puntos. Se pueden dar tres tipos: 1. Correlacin fuerte La correlacin ser fuerte cuanto ms cerca estn los puntos de la recta.
2. Correlacin dbil La correlacin ser dbil cuanto ms separados estn los puntos de la recta.
3. Correlacin nula Recta de regresin de Y sobre X La recta de regresin de Y sobre X se utiliza para estimar los valores de la Y a partir de los de la X. La pendiente de la recta es el cociente entre la covarianza y la varianza de la variable X.
Recta de regresin de X sobre Y La recta de regresin de X sobre Y se utiliza para estimar los valores de la X a partir de los de la Y. La pendiente de la recta es el cociente entre la covarianza y la varianza de la variable Y.
Si la correlacin es nula, r = 0, las rectas de regresin son perpendiculares entre s, y sus eucaciones son: y= x= Relacin funcional Dos variables x e y estn relacionadas funcionalmente cuando conocida la primera se puede saber con exactitud el valor de la segunda. Ejemplo Si se deja caer una piedra, existe una frmula que nos permite calcular exactamente, la altura a la que se encuentra en funcin del tiempo transcurrido. h = g t. Relacin estadstica Dos variables x e y estn relacionadas estadsticamente cuando conocida la primera se puede estimar aproximadamente el valor de la segunda. Ejemplos Ingresos y gastos de una familia.
Produccin y ventas de una fbrica. Gastos en publicidad y beneficios de una empresa. Si representamos cada par de valores como las coordenadas de un punto, el conjunto de todos ellos se llama nube de puntos o diagrama de dispersin.
Variable estadstica bidimensional Una variable bidimensional es una variable en la que cada individuo est definido por un par de caracteres, (X, Y). Estos dos caracteres son a su vez variables estadsticas en las que s existe relacin entre ellas, una de las dos variables es la variable independiente y la otra variable dependiente. Distribucin bidimensional Una distribucin bidimensional es aquella en las que a cada individuo le corresponden los valores de dos variables, las representamos por el par (xi, yi). Si representamos cada par de valores como las coordenadas de un punto, el conjunto de todos ellos se llama nube de puntos o diagrama de dispersin. Sobre la nube de puntos puede trazarse una recta que se ajuste a ellos lo mejor posible, llamada recta de regresin. Ejemplo Las notas de 12 alumnos de una clase en Matemticas y Fsica son las siguientes: Matemticas 2 3 4 4 5 6 6 7 7 8 10 10 Fsica 1 3 2 4 4 4 6 4 6 7 9 10
Covarianza La covarianza de una variable bidimensional es la media aritmtica de los productos de las desviaciones de cada una de las variables respecto a sus medias respectivas. La covarianza se representa por sxy o xy.
La covarianza indica el sentido de la correlacin entre las variables Si xy >0 la correlacin es directa. Si xy <0 la correlacin es inversa. La covarianza presenta como inconveniente, el hecho de que su valor depende de la escala elegida para los ejes. Es decir, la covarianza variar si expresamos la altura en metros o en centmetros. Tambin variar si el dinero lo expresamos en euros o en dlares. Ejemplos Las notas de 12 alumnos de una clase en Matemticas y Fsica son las siguientes: Matemticas 2 3 4 4 5 6 6 7 7 8 10 10 Fsica 1 3 Hallar la covarianza de la distribucin. xi 2 3 4 4 yi 1 3 2 4 xi yi 2 9 8 16 2 4 4 4 6 4 6 7 9 10
5 6 6 7 7 8 10 10 72
4 4 6 4 6 7 9 10 60
20 24 36 28 42 56 90 100 431
3 2 5 0 Hallar la covarianza de la distribucin. En primer lugar convertimos la tabla de doble entrada en tabla simple y calculamos las medias aritmticas. xi 0 0 0 2 2 2 4 4 yi 1 2 3 1 2 3 1 2 fi 2 1 2 1 4 5 3 2 xi fi 0 0 0 2 8 10 12 8 y i fi 2 2 6 1 8 15 3 4 xi yi fi 0 0 0 2 16 30 12 16
20
40
41
76
Correlacin estadstica La correlacin estadstica determina la relacin o dependencia que existe entre las dos variables que intervienen en una distribucin bidimensional. Es decir, determinar si los cambios en una de las variables influyen en los cambios de la otra. En caso de que suceda, diremos que las variables estn correlacionadas o que hay correlacin entre ellas.
Propiedades 1. El coeficiente de correlacin no vara al hacerlo la escala de medicin. Es decir, si expresamos la altura en metros o en centmetros el coeficiente de correlacin no vara. 2. El signo del coeficiente de correlacin es el mismo que el de la covarianza. Si la covarianza es positiva, la correlacin es directa. Si la covarianza es negativa, la correlacin es inversa. Si la covarianza es nula, no existe correlacin. 3. El coeficiente de correlacin lineal es un nmero real comprendido entre menos 1 y 1. 1 r 1 4. Si el coeficiente de correlacin lineal toma valores cercanos a 1 la correlacin es fuerte e inversa, y ser tanto ms fuerte cuanto ms se aproxime r a 1. 5. Si el coeficiente de correlacin lineal toma valores cercanos a 1 la correlacin es fuerte y directa, y ser tanto ms fuerte cuanto ms se aproxime r a 1. 6. Si el coeficiente de correlacin lineal toma valores cercanos a 0, la correlacin es dbil. 7. Si r = 1 1, los puntos de la nube estn sobre la recta creciente o decreciente. Entre ambas variables hay dependencia funcional. Ejercicios Las estaturas y pesos de 10 jugadores de baloncesto de un equipo son: Estatura (X) 186 189 190 192 193 193 198 201 Pesos (Y) 85 85 86 Calcular el coeficiente de correlacin. xi yi xi2 yi2 xi yi 90 87 91 93 103
203 100
205 101
34 186 85 5 9 6 35 189 85 7 2 1 36 190 86 1 0 0 36 192 90 8 6 4 37 193 87 2 4 9 37 193 91 2 4 9 39 198 93 2 0 4 40 201 103 4 0 1 41 203 100 2 0 9 42 205 101 0 2 5
7 2 2 5 7 2 2 5 7 3 9 6 8 1 0 0 7 5 6 9 8
15 81 0 16 06 5 16 34 0 17 28 0 16 79 1
2 17563 8 1 8 6 4 9 10 6 0 9 10 0 0 0 10 2 0 1 18 41 4 20 70 3 20 30 0 20 70 5
1 9 921 5 0
380 6 1 8
85 2 5 5
179 97 1
Correlacin positiva muy fuerte. Los valores de dos variables X e Y se distribuyen segn la tabla siguiente: Y/X 100 50 25 14 18 1 2 1 3 0 0
22 0 1 2 Obtener e interpretar el coeficiente de correlacin lineal. Convertimos la tabla de doble entrada en una tabla simple. xi 100 100 50 50 50 25 yi 14 18 14 18 22 22 fi 1 2 1 3 1 2 10 xi fi 100 200 50 150 50 50 600 xi2 fi 10 000 20 000 2 500 7 500 2 500 1 250 43 750 y i fi 14 36 14 54 22 44 184 yi2 fi 196 648 196 972 484 968 3 464 xi yi fi 1 400 3 600 700 2 700 1 100 1 100 10 600
En las distribuciones bidimensionales a cada individuo le corresponden los valores de dos variables, las representamos por el par (xi, yi). Si representamos cada par de valores como las coordenadas de un punto, el conjunto de todos ellos se llama nube de puntos o diagrama de dispersin. Sobre la nube de puntos puede trazarse una recta que se ajuste a ellos lo mejor posible, llamada recta de regresin. Ejemplo Las notas de 12 alumnos de una clase en Matemticas y Fsica son las siguientes: Matemticas 2 3 4 4 5 6 6 7 7 8 10 10 Fsica 1 3 2 4 4 4 6 4 6 7 9 10
Diagrama de dispersin 1 Correlacin directa La recta correspondiente a la nube de puntos de la distribucin es una recta creciente.
2 Correlacin inversa La recta correspondiente a la nube de puntos de la distribucin es una recta decreciente.
3 Correlacin nula En este caso se dice que las variables son incorreladas y la nube de puntos tiene una forma redondeada.
Grado de correlacin El grado de correlacin indica la proximidad que hay entre los puntos de la nube de puntos. Se pueden dar tres tipos: 1. Correlacin fuerte La correlacin ser fuerte cuanto ms cerca estn los puntos de la recta.
2. Correlacin dbil La correlacin ser dbil cuanto ms separados estn los puntos de la recta.
3. Correlacin nula
Regresin Recta de regresin de Y sobre X La recta de regresin de Y sobre X se utiliza para estimar los valores de la Y a partir de los de la X. La pendiente de la recta es el cociente entre la covarianza y la varianza de la variable X.
Recta de regresin de X sobre Y La recta de regresin de X sobre Y se utiliza para estimar los valores de la X a partir de los de la Y. La pendiente de la recta es el cociente entre la covarianza y la varianza de la variable Y.
Si la correlacin es nula, r = 0, las rectas de regresin son perpendiculares entre s, y sus eucaciones son: y= x= Ejemplo Las notas de 12 alumnos de una clase en Matemticas y Fsica son las siguientes: Matemticas 2 3 4 4 5 6 6 7 7 8 10 Fsica 1 3 2 4 Hallar las rectas de regresin y representarlas. xi 2 3 yi 1 3 xi yi 2 9 xi2 4 9 yi2 1 9 4 4 6 4 6 7 9
10 10
4 4 5 6 6 7 7 8 10 10 72
2 4 4 4 6 4 6 7 9 10 60
8 16 20 24 36 28 42 56 90 100 431
4 16 16 16 36 16 36 49 81 100 380
2 Calculamos la covarianza.