Tarea Estaditica

CORRELACION SIMPLE
 ANÁLISIS DE CORRELACIÓN:
Mide el grado de intensidad de esta posible relación entre las variables. Este
coeficiente se aplica cuando la relación que puede existir entre las variables es
lineal (es decir, si representáramos en un gráfico los pares de valores de las dos
variables la nube de puntos se aproximaría a una recta).
No obstante, puede que exista una relación que no sea lineal, sino exponencial,
parabólica, etc. En estos casos, el coeficiente de correlación lineal mediría mal
la intensidad de la relación las variables, por lo que convendría utilizar otro tipo
de coeficiente más apropiado.
COEFICIENTE DE CORRELACIÓN
El coeficiente de correlación lineal es el cociente entre la covarianza y el producto
de las desviaciones típicas de ambas variables el coeficiente de correlación lineal
se expresa mediante la letra r
 El coeficiente de correlación no varía al hacerle la escala de medición
 El signo del coeficiente de correlación es el mismo que el de la covarianza
 El coeficiente de correlación lineal es un número real comprendido entre -1
y1
𝐧∑𝐱 ∗ 𝐲 − ∑𝐱 ∗ ∑𝐲
𝐫=
√𝐧 ∗ ∑ 𝐱 𝟐 − (∑ 𝐱)^𝟐 ∗ √𝐧 ∗ ∑ 𝐲 𝟐 − (∑ 𝐲)^𝟐
EJERCICIO DE APLICACIÓN
Las notas de 12 alumnos de una clase en Matemáticas y Física son las

siguientes:
Matemáticas Física
2 1
3 3
4 2
4 4
5 4
6 4
6 6
7 4
7 6
8 7
10 9
10 10
Hallar el coeficiente de correlación de la distribución e interpretarlo.
xi yi xi ·yi xi2 yi2

2 1 2 4 1
3 3 9 9 9
4 2 8 16 4
4 4 16 16 16
5 4 20 25 16
6 4 24 36 16
6 6 36 36 36
7 4 28 49 16
7 6 42 49 36
8 7 56 64 49
10 9 90 100 81
10 10 100 100 100
72 60 431 504 380
1º Hallamos las medias aritméticas.
medias
2º Calculamos la covarianza.
covarianza
3º Calculamos las desviaciones típicas.
desviaciones típicas
4º Aplicamos la fórmula del coeficiente de correlación lineal.
coeficiente de correlación lineal
Al ser el coeficiente de correlación positivo, la correlación es directa.
Como coeficiente de correlación está muy próximo a 1 la correlación es muy

fuerte.
 COEFICIENTE DE DETERMINACIÓN
En estadística, el coeficiente de determinación, denominado R² y pronunciado R

cuadrado, es un estadístico usado en el contexto de un modelo estadístico cuyo
principal propósito es predecir futuros resultados o probar una hipótesis. El
coeficiente determina la calidad del modelo para replicar los resultados, y la
proporción de variación de los resultados que puede explicarse por el modelo.
Hay varias definiciones diferentes para R² que son algunas veces equivalentes.
Las más comunes se refieren a la regresión lineal. En este caso, el R² es
simplemente el cuadrado del coeficiente de correlación de Pearson, lo cual es sólo
cierto para la regresión lineal simple. Si existen varios resultados para una única
variable, es decir, para una X existe una Y, Z... el coeficiente de determinación
resulta del cuadrado del coeficiente de determinación múltiple. En ambos casos el
R² adquiere valores entre 0 y 1. Existen casos dentro de la definición
computacional de R² donde este valor puede tomar valores negativos.
FORMULA.-
𝐫𝟐 = 𝐫 ∗ 𝐫
EJERCICIO DE APLICACIÓN:
𝟕(𝟑𝟓𝟕) − (𝟖𝟕 ∗ 𝟕𝟓)

𝐫=
√𝟓𝟑(𝟒𝟓𝟒) − 𝟏𝟕𝟕𝟖 ∗ √𝟕(𝟒𝟓𝟒) − 𝟐𝟒𝟎𝟎
𝐫 = 𝟎. 𝟗𝟏
𝐫 𝟐 = 𝟎. 𝟗𝟏 ∗ 𝟎. 𝟗𝟏
𝐫 𝟐 = 𝟎. 𝟖𝟐
 COEFICIENTE DE NO DETERMINACIÓN:
El coeficiente de no determinación es la variación no explicada por la regresión. Al

ser excluyente estos coeficientes, el coeficiente de no determinación queda
definido por
FORMULA.
𝐶𝑁𝐷 = 1 − 𝑟 2
𝟕(𝟒𝟓𝟒) − (𝟑𝟐 ∗ 𝟓𝟒)

𝐫=
√𝟕(𝟒𝟓𝟒) − 𝟏𝟒𝟐𝟓 ∗ √𝟕(𝟓𝟐𝟏) − 𝟒𝟓𝟕𝟏
𝐫 = 𝟎. 𝟗𝟏
𝐫 𝟐 = 𝟎. 𝟗𝟏 ∗ 𝟎. 𝟗𝟏
𝐫 𝟐 = 𝟎. 𝟖𝟏
𝐂𝐍𝐃 = 𝟏 − 𝐫 𝟐
𝐂𝐍𝐃 = 𝟏 − 𝟎. 𝟖𝟖𝟐
𝐂𝐍𝐃 = 𝟎. 𝟐𝟖
 CORRELACIÓN DE RANGO:
El coeficiente de correlación de Spearman se rige por las reglas de la correlación

simple de Pearson, y las mediciones de este índice corresponden de + 1 a - 1,
pasando por el cero, donde este último significa no correlación entre las variables
estudiadas, mientras que los dos primeros denotan la correlación máxima.
La ecuación utilizada en este procedimiento, cuando en el ordenamiento de los

rangos de las observaciones no hay datos empatados o ligados, es la siguiente:
Donde:
rs = coeficiente de correlación de Spearman.

d2 = diferencias existentes entre los rangos de las dos variables, elevadas al
cuadrado.
N = tamaño de la muestra expresada en parejas de rangos de las variables.
S = sumatoria.
Pasos.
Clasificar en rangos cada medición de las observaciones.

Obtener las diferencias de las parejas de rangos de las variables estudiadas y
elevadas al cuadrado.
Efectuar la sumatoria de todas las diferencias al cuadrado.
Aplicar la ecuación.
Calcular los grados de libertad (gl). gl = número de parejas - 1. Solo se utilizará
cuando la muestra sea mayor a 10.
Comparar el valor r calculado con respecto a los valores críticos de la tabla de
valores críticos de t de Kendall en función de probabilidad.
Decidir si se acepta o rechaza la hipótesis.
FORMULA.
𝟔 ∑ 𝐝𝟐
𝐫𝐬 = 𝟏 −
𝐧(𝐧𝟐 − 𝟏)
Un investigador está interesado en conocer si el desarrollo mental de un niño esta
asociado a la educación formal de su madre. De esta manera, obtiene la
calificación de desarrollo mental en la escala de Gesell de ocho niños elegidos
aleatoriamente y se informa del grado de escolaridad de las madres.
 ANÁLISIS DE REGRESIÓN
En estadística, el análisis de la regresión es un proceso estadístico para estimar

las relaciones entre variables. Incluye muchas técnicas para el modelado y
análisis de diversas variables, cuando la atención se centra en la relación entre
una variable dependiente y una o más variables independientes (o predictoras).
Más específicamente, el análisis de regresión ayuda a entender cómo el valor de
la variable dependiente varía al cambiar el valor de una de las variables
independientes, manteniendo el valor de las otras variables independientes fijas.
Más comúnmente, el análisis de regresión estima la esperanza condicional de la
variable dependiente dadas las variables independientes - es decir, el valor
promedio de la variable dependiente cuando se fijan las variables
independientes. Con menor frecuencia, la atención se centra en un cuantil, u otro
parámetro de localización de la distribución condicional de la variable
dependiente dadas las variables independientes. En todos los casos, el objetivo
es la estimación de una función de las variables independientes llamada
la función de regresión. En el análisis de regresión, también es de interés para
caracterizar la variación de la variable dependiente en torno a la función de
regresión que puede ser descrito por una distribución de probabilidad.
FORMULAS
(∑ 𝑥∗𝑦−𝑑)
 𝑏1 = (∑ 𝑥 2 −𝑐)
∑𝑥
 𝑥𝑝𝑟𝑜𝑚𝑒𝑑𝑖𝑜 = 𝑛
∑𝑦
 𝑦𝑝𝑟𝑜𝑚𝑒𝑑𝑖𝑜 = 𝑛
 𝑏0 = 𝑦𝑝𝑟𝑜𝑚𝑒𝑑𝑖𝑜 − (𝑏1 ∗ 𝑥𝑝𝑟𝑜𝑚𝑒𝑑𝑖𝑜 )
 𝑦 = 𝑏0 + 𝑏1(𝑥)
 𝑒 = 𝑦𝑖 − 𝑦
EJERCICIO DE APLICACIÓN
No costos(x) producción(y) x*y x^2 Y e=yi-y

1 60 100 6000 3600 97.8 2.2
2 65 105 6825 4225 103.35 1.65
3 70 102 7140 4900 108.9 -6.9
4 75 135 10125 5625 114.45 20.55
5 80 95 7600 6400 120 -25
6 85 125 10625 7225 125.55 -0.55
7 90 140 12600 8100 131.1 8.9
8 95 130 12350 9025 136.65 -6.65
9 100 148 14800 10000 142.2 5.8
Total 720 1080 88065 59100 1080
∑𝑥 720
𝑥𝑝𝑟𝑜𝑚𝑒𝑑𝑖𝑜 = 𝑥𝑝𝑟𝑜𝑚𝑒𝑑𝑖𝑜 = 𝑥 = 80
𝑛 9 𝑝𝑟𝑜𝑚𝑒𝑑𝑖𝑜
∑𝑦 1080
𝑦𝑝𝑟𝑜𝑚𝑒𝑑𝑖𝑜 = 𝑦𝑝𝑟𝑜𝑚𝑒𝑑𝑖𝑜 = 𝑦𝑝𝑟𝑜𝑚𝑒𝑑𝑖𝑜 = 120
𝑛 9
𝑐 = 720 ∗ 80 𝑑 = 1080 ∗ 120

𝑐 = 57600 𝑑 = 86400
2.1) ECUACION PARA HALLAR LA PENDIENTE
(∑ 𝑥 ∗ 𝑦 − 𝑑)
𝑏1 =
(∑ 𝑥 2 − 𝑐)
88065 − 86400
𝑏1 =
59100 − 57600
𝑏1 = 1.11
2.3) ECUACION PAR HALLAR LA INTERCCION CON EL EJE
𝑏0 = 𝑦𝑝𝑟𝑜𝑚𝑒𝑑𝑖𝑜 − (𝑏1 ∗ 𝑥𝑝𝑟𝑜𝑚𝑒𝑑𝑖𝑜 )
𝑏0 = 120 − (1.11 ∗ 80 )
𝑏0 = 31.2
2.4) ECUACION DE LA RECTA DE REGRECION
𝑦 = 𝑏0 + 𝑏1(𝑥)
𝑦 = 31.2 + 11.1(𝑥)
2.5) CALCULO DE ERRORES DE LAS VARIABLES
𝑒 = 𝑦𝑖 − 𝑦
 MUESTREO
En ocasiones en que no es posible o conveniente realizar un censo

(analizar a todos los elementos de una población), se selecciona una
muestra, entendiendo por tal una parte representativa de la población.
El muestreo es por lo tanto una herramienta de la investigación científica,

cuya función básica es determinar que parte de una población debe
producción(y) Y e=yi-y
100 97.8 2.2
105 103.35 1.65
102 108.9 -6.9
135 114.45 20.55
95 120 -25
125 125.55 -0.55
140 131.1 8.9
130 136.65 -6.65
148 142.2 5.8
examinarse, con la finalidad de hacer inferencias sobre dicha población.
La muestra debe lograr una representación adecuada de la población, en

la que se reproduzca de la mejor manera los rasgos esenciales de dicha
población que son importantes para la investigación. Para que una
muestra sea representativa, y por lo tanto útil, debe de reflejar las
similitudes y diferencias encontradas en la población, es decir ejemplificar
las características de ésta.
3.1) TIPOS DE MUESTREO
Existen diferentes criterios de clasificación de los diferentes tipos de

muestreo, aunque en general pueden dividirse en dos grandes grupos:
métodos de muestreo probabilísticos y métodos de muestreo no
probabilísticos.
3.2) MUESTREO PROBABILISTICO
Los métodos de muestreo probabilísticos son aquellos que se basan en

el principio de equiprobabilidad. Es decir, aquellos en los que todos los
individuos tienen la misma probabilidad de ser elegidos para formar parte
de una muestra y, consiguientemente, todas las posibles muestras de
tamaño n tienen la misma probabilidad de ser seleccionadas. Sólo estos
métodos de muestreo probabilísticos nos aseguran la representatividad
de la muestra extraída y son, por tanto, los más recomendables. Dentro
de los métodos de muestreo probabilísticos encontramos los siguientes
tipos:
3.3) MUESTREO ALEATORIO SIMPLE
El procedimiento empleado es el siguiente: se asigna un número a cada

individuo de la población y a través de algún medio mecánico (bolas
dentro de una bolsa, tablas de números aleatorios, números aleatorios
generados con una calculadora u ordenador, se eligen tantos sujetos
como sea necesario para completar el tamaño de muestra requerido. Este
procedimiento, atractivo por su simpleza, tiene poca o nula utilidad
práctica cuando la población que estamos manejando es muy grande
3.4) MUESTREO ALEATORIO SISTEMATICO
Este procedimiento exige, como el anterior, numerar todos los elementos

de la población, pero en lugar de extraer n números aleatorios sólo se
extrae uno. Se parte de ese número aleatorio i, que es un número elegido
al azar, y los elementos que integran la muestra son los que ocupa los
lugares i, i+k, i+2k, i+3k,...,i+(n-1)k, es decir se toman los individuos de k
en k, siendo k el resultado de dividir el tamaño de la población entre el
tamaño de la muestra: k= N/n. El número i que empleamos como punto
de partida será un número al azar entre 1 y k.
3.5) MUESTREO ALEATORIO ESTRATIFICADO
Trata de obviar las dificultades que presentan los anteriores ya que

simplifican los procesos y suelen reducir el error muestral para un tamaño
dado de la muestra. Consiste en considerar categorías típicas diferentes
entre sí (estratos) que poseen gran homogeneidad respecto a alguna
característica (se puede estratificar, por ejemplo, según la profesión, el
municipio de residencia, el sexo, el estado civil, etc.). Lo que se pretende
con este tipo de muestreo es asegurarse de que todos los estratos de
interés estarán representados adecuadamente en la muestra. Cada
estrato funciona independientemente, pudiendo aplicarse dentro de ellos
el muestreo aleatorio simple o el estratificado para elegir los elementos
concretos que formarán parte de la muestra. En ocasiones las dificultades
que plantean son demasiado grandes, pues exige un conocimiento
detallado de la población.

Tarea Estaditica

Cargado por

Información del documentohacer clic para expandir la información del documento

Copyright:

Formatos disponibles

Tarea Estaditica

Cargado por

Información del documento

Descripción original:

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Tarea Estaditica

Cargado por

Copyright:

Formatos disponibles

CORRELACION SIMPLE

Las notas de 12 alumnos de una clase en Matemáticas y Física son las

xi yi xi ·yi xi2 yi2

1º Hallamos las medias aritméticas.

3º Calculamos las desviaciones típicas.

4º Aplicamos la fórmula del coeficiente de correlación lineal.

coeficiente de correlación lineal

Al ser el coeficiente de correlación positivo, la correlación es directa.

Como coeficiente de correlación está muy próximo a 1 la correlación es muy

En estadística, el coeficiente de determinación, denominado R² y pronunciado R

𝟕(𝟑𝟓𝟕) − (𝟖𝟕 ∗ 𝟕𝟓)

El coeficiente de no determinación es la variación no explicada por la regresión. Al

𝟕(𝟒𝟓𝟒) − (𝟑𝟐 ∗ 𝟓𝟒)

El coeficiente de correlación de Spearman se rige por las reglas de la correlación

La ecuación utilizada en este procedimiento, cuando en el ordenamiento de los

rs = coeficiente de correlación de Spearman.

Clasificar en rangos cada medición de las observaciones.

En estadística, el análisis de la regresión es un proceso estadístico para estimar

 𝑏0 = 𝑦𝑝𝑟𝑜𝑚𝑒𝑑𝑖𝑜 − (𝑏1 ∗ 𝑥𝑝𝑟𝑜𝑚𝑒𝑑𝑖𝑜 )

No costos(x) producción(y) x*y x^2 Y e=yi-y

𝑐 = 720 ∗ 80 𝑑 = 1080 ∗ 120

2.1) ECUACION PARA HALLAR LA PENDIENTE

2.3) ECUACION PAR HALLAR LA INTERCCION CON EL EJE

𝑏0 = 𝑦𝑝𝑟𝑜𝑚𝑒𝑑𝑖𝑜 − (𝑏1 ∗ 𝑥𝑝𝑟𝑜𝑚𝑒𝑑𝑖𝑜 )

2.4) ECUACION DE LA RECTA DE REGRECION

2.5) CALCULO DE ERRORES DE LAS VARIABLES

En ocasiones en que no es posible o conveniente realizar un censo

El muestreo es por lo tanto una herramienta de la investigación científica,

La muestra debe lograr una representación adecuada de la población, en

Existen diferentes criterios de clasificación de los diferentes tipos de

3.2) MUESTREO PROBABILISTICO

Los métodos de muestreo probabilísticos son aquellos que se basan en

3.3) MUESTREO ALEATORIO SIMPLE

El procedimiento empleado es el siguiente: se asigna un número a cada

3.4) MUESTREO ALEATORIO SISTEMATICO

Este procedimiento exige, como el anterior, numerar todos los elementos

3.5) MUESTREO ALEATORIO ESTRATIFICADO

Trata de obviar las dificultades que presentan los anteriores ya que

También podría gustarte