ESTADÍSTICA Semana 9 CONFERENCIA

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 36

ESTADÍSTICA

ESCUELA DE PSICOLOGÍA

Docente: Segundo O. Rodríguez Bellina

9° SEMANA
CORRELACIÓN
¿Hay relaciones?

¿Fuertes? ¿Débiles?

¿En que medida están relacionadas?


¿Puedo predecir una variable a partir de la otra?
Relaciones
CORRELACIÓN
Por ejemplo:
La altura y el peso.

Las horas de estudio y la calificación en un examen.

Una empresa de desarrollo de software establece relacionar sus ventas en


función del numero de pedidos.

Ejemplo de una correlación tipo múltiple:


Una empresa de desarrollo de software establece relacionar sus ventas en
función del numero de pedidos de los tipos de software que desarrolla.
CORRELACIÓN
El coeficiente de correlación de Pearson es una prueba que mide la relación
estadística entre dos variables continuas. Si la asociación entre los
elementos no es lineal, entonces el coeficiente no se encuentra
representado adecuadamente.

Para llevar a cabo la correlación de Pearson es necesario cumplir lo


siguiente:
La escala de medida debe ser una escala de intervalo o razón.
Las variables deben estar distribuida de forma aproximada Normal.
La asociación debe ser lineal.
No debe haber valores atípicos en los datos.
Independencia - Dependencia
Cuando se estudian dos características simultáneamente sobre una muestra,
se puede considerar que una de ellas influye sobre la otra de alguna
manera. Por ejemplo la altura y el peso o las horas de estudio y la
calificación en un examen.
El objetivo principal de la CORRELACIÓN es descubrir el modo en que se
relacionan.

Dos variables pueden considerarse:

Variables independientes(X) → No tienen relación (una de ellas no sirve


para explicar los movimientos de la otra). También llamada variable
predictora: La que se utiliza para hacer pronósticos.
Independencia - Dependencia
Variable dependiente (Y) llamada variable criterio: Sobre la que se
pronóstica

Dependencia funcional → Y=f(x)


Dependencia estadística

Dependencia
Independencia estadística estadística Dependencia funcional

- +
Grado de asociación entre dos variables
Relaciones
CORRELACIÓN
Si medimos la relación decimos que medimos
una correlación entre las variables

¿Cómo?

Gráfica Analítica
Método Gráfico

Cada punto representa a un sujeto, y señala la intersección de su


valor en X y en Y

A la gráfica se le llama Diagrama de dispersión o Nube de puntos.

El diagrama de dispersión
Es un gráfico que permite detectar la existencia de una relación entre dos
variables.

Visualmente se puede buscar patrones que indiquen el tipo de relación


que se da entre las variables.
Relaciones posibles entre X y Y
vistos en diagramas de dispersión

(a) Lineal directa (b) Lineal inversa (c) Curvilínea directa


Y Y Y
• •
• • • • •
• • •
• •• • ••
• • • •
•• •• •
X X X

Y • Y Y
• •• • • • ••
•• •
•• • •• • • •
• •• • • • • ••
•• •• •• • • •
•• • ••• •
• •
X X X
(d) Curvilínea inversa (e) Lineal inversa (d) Ninguna relación
con más dispersión
¿Cómo sabemos qué tan
fuerte es la relación?

Por el ancho de la nube de puntos


HOMOCEDASTCIDAD
Que exista aproximadamente la misma desviación de los puntos a lo largo
de la línea imaginaria
Método analítico
(-)

Dirección
Índice r de Pearson

(-) (+)
( +)

−𝟏 𝟎 +𝟏
Magnitud

Magnitud:
Baja: 0.30
Media: 0.50 C 𝟏
Alta: 0.70 𝑨 𝒎𝒂𝒚𝒐𝒓 𝒏ú𝒎𝒆𝒓𝒐
Mayor correlación
Perfecta: 1
Aplicación
Se quiere conocer la relación entre los datos de peso y talla de 10 individuos
que se presentan a continuación:

Personas 1 2 3 4 5 6 7 8 9 10
Peso (Kg) 61 60 78 62 60 54 84 68 62 72
Altura (Cm) 162 154 180 158 171 169 166 176 163 168

Presente la información en un diagrama de dispersión


Procedimiento
1er Paso: Reúna pares de datos (X,Y), cuya relación desea estudiar y
organice la información en una tabla.
Personas 1 2 3 4 5 6 7 8 9 10
Peso (Kg) 61 60 78 62 60 54 84 68 62 72
Altura (Cm) 162 154 180 158 171 169 166 176 163 168

2do Paso: Encuentre los valores mínimos y máximos para X e Y. Elija las
escalas que se usarán en los ejes horizontal y vertical, de manera que ambas
longitudes sean aproximadamente iguales, facilitando la lectura del
diagrama.
3er Paso: Registre los datos en el gráfico. Cuando se obtengan los mismos
valores en diferentes observaciones, muestre estos puntos haciendo círculos
concéntricos (o), o registre el segundo punto muy cerca del primero.
185

180

175
ALTURA

170

165

160

155
0 10 20 30 40 50 60 70 80 90
PESO
4to Paso: Agregue toda la información que puede ser de utilidad para
entender el diagrama, tal como: título del diagrama, período de tiempo,
número de pares de datos, nombre de la variable y unidades de cada eje,
entre otros.
Relación de los pesos y altura de las personas
185
180
175
ALTURA

170
165
160
155
0 20 40 60 80 100
PESO
𝑭𝒖𝒆𝒏𝒕𝒆: 𝑬𝒍𝒂𝒃𝒐𝒓𝒂𝒄𝒊ó𝒏 𝒑𝒓𝒐𝒑𝒊𝒂
El análisis de correlación
El análisis de correlación es la técnica estadística que permite describir el
grado hasta el cual una variable está linealmente relacionada con otra.
Hay dos medidas que se usan para describir la correlación
▪ El coeficiente de correlación ( r )
𝟐
▪El coeficiente de determinación 𝒓

N  XY − ( X )( Y )
r=
N   
 
2 2
− −
2 2
 X (  X )  
N Y (  Y ) 

N=Número de pares
Formula de correlación de Pearson para datos agrupados:

𝒏 σ 𝒇𝒊 𝑿𝒊 𝒀𝒊 − ቀσ𝒇𝒊 𝑿𝒊 ሻ൫σ𝒇𝒊 𝒀𝒊 ሻ
𝒓=
𝒏 σ 𝒇𝒊 𝑿𝟐𝒊 − ൫σ 𝒇𝒊 𝑿𝒊 ሻ𝟐 𝒏 σ 𝒇𝒊 𝒀𝟐𝒊 − ൫σ 𝒇𝒊 𝒀𝒊 ሻ𝟐

𝒇𝒊 = 𝒏𝒊 = 𝑭𝒓𝒆𝒄𝒖𝒆𝒏𝒄𝒊𝒂𝒔 𝒂𝒃𝒔𝒐𝒍𝒖𝒕𝒂𝒔.
Personas 1 2 3 4 5 6 7 8 9 10 TOTAL
Peso (Kg) (X) 61 60 78 62 60 62 84 68 62 72 669
Altura (Cm) (Y) 162 160 180 165 165 169 180 170 163 170 1684
X*X 3721 3600 6084 3844 3600 3844 7056 4624 3844 5184 45401
Y*Y 26244 25600 32400 27225 27225 28561 32400 28900 26569 28900 284024
X*Y 9882 9600 14040 10230 9900 10478 15120 11560 10106 12240 113156

𝟏𝟎 𝟏𝟏𝟑𝟏𝟓𝟔 − (𝟔𝟔𝟗ሻ(𝟏𝟔𝟖𝟒ሻ
𝒓= = 𝟎. 𝟗𝟑𝟒
[𝟏𝟎 𝟒𝟓𝟒𝟎𝟏 − (𝟔𝟔𝟗ሻ𝟐 ][𝟏𝟎 𝟐𝟖𝟒𝟎𝟐𝟒 − (𝟏𝟔𝟖𝟒ሻ𝟐 ]
N=Número de pares

El valor obtenido es próximo a 1, lo que nos confirma que la correlación


es fuertemente positiva entre el peso y la talla.
Significancia estadística: Prueba de hipótesis
El valor del coeficiente de correlación (r ) determina si existe una relación lineal
entre las variables. Sin embargo, no indica si esta relación es estadísticamente
significativa. Para ello se aplica la prueba de hipótesis del parámetro 𝝆(𝒓𝒉𝒐ሻ.
Como en toda prueba de hipótesis, la hipótesis nula (𝑯𝟎 ሻ establece que no existe
una relación, es decir, que el coeficiente de correlación (𝝆 ) es igual a cero.
Mientras que la hipótesis alterna (𝑯𝟏 ሻ propone que sí existe una relación
significativa por lo que 𝝆 debe ser diferente de cero.
𝑯𝟎 : 𝝆 = 𝟎
𝑯𝟏 : 𝝆 ≠ 𝟎
El estadístico de prueba que revela si la hipótesis nula (𝑯𝟎 ) es o no verdadera
es la siguiente:

𝒏−𝟐
𝒕(𝒏−𝟐ሻ =𝒓 Siendo n-2=g.l. g.l.=Grados de libertad
𝟏 − 𝒓𝟐
Procedimiento ejemplo anterior
1) Plantear las hipótesis:
𝑯𝟎 : 𝝆 = 𝟎
𝑯𝟏 : 𝝆 ≠ 𝟎

2) Seleccionar el nivel de significación:  = 0.05


3) Elegir la prueba estadística:

𝒏−𝟐
𝒕(𝒏−𝟐ሻ =𝒓
𝟏 − 𝒓𝟐
4) Determinación de los criterios de decisión

𝑹𝒆𝒈𝒊ó𝒏 𝒅𝒆 𝒓𝒆𝒄𝒉𝒂𝒛𝒐 𝑹𝒆𝒈𝒊ó𝒏 𝒅𝒆 𝒓𝒆𝒄𝒉𝒂𝒛𝒐


/2 = 𝟎. 𝟎𝟐𝟓 (1 - ) /2 = 𝟎. 𝟎𝟐𝟓
𝑹𝒆𝒈𝒊ó𝒏 𝒅𝒆 𝒂𝒄𝒆𝒑𝒕𝒂𝒄𝒊ó𝒏

-t8 t8
-2.306 2,306 7.39
𝒕(𝒏−𝟐ሻ = 𝒕(𝟏𝟎−𝟐ሻ = 𝒕𝟎.𝟗𝟕𝟓:𝟖 = 𝟐. 𝟑𝟎𝟔

Si { -2.306  tc  2.306 } se acepta la Ho, en caso contrario se


rechaza.
5) Cálculos:
𝒏−𝟐 𝟏𝟎−𝟐
𝒕(𝒏−𝟐ሻ =𝒓 𝒕𝒄 = 𝟎. 𝟗𝟑𝟒 = 𝟕. 𝟑𝟗
𝟏 − 𝒓𝟐 𝟏−𝟎.𝟗𝟑𝟒𝟐
6) Conclusiones

(1) Se rechaza la hipótesis planteada y se acepta la hipótesis alternante a


un nivel de significación de 0,05. La prueba resultó ser significativa.

(2) La evidencia estadística permite rechazar la hipótesis planteada.

(3) Por lo tanto los datos muestrales confirman que existe una alta
correlación positiva entre el peso y la talla de las personas.
“Si no escalas la montaña, jamás podrás disfrutar del
paisaje”. Pablo Neruda.

https://www.google.com/search?q=curgos+huamachuco&rlz=1C1PRFI_enPE854PE854&source=lnms&tbm=isch&sa
=X&ved=2ahUKEwieqKSV1KzqAhVnUN8KHbyCBZ8Q_AUoAnoECBYQBA&biw=1024&bih=625#imgrc=7-
MORUHMhsQnrM&imgdii=QG34wgH6H7in7M

También podría gustarte