S6 Estadistica

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 15

SEMANA 6

ESTADÍSTICA Y
PROBABILIDADES
Contenido

I. Introducción ................................................................................................... 3

II. Relación entre las variables ...................................................................... 4

III. Regresión lineal simple .............................................................................. 9

IV. Bibliografía ................................................................................................... 14


3 Apunte de clase

I. Introducción

Lo que se revisará en esta semana es una de las aplicaciones más interesantes

que se realizan con las herramientas de estadística. Existen muchas aplicaciones

de la vida real donde se puede ver el concepto de regresión lineal (o regresión

simple), por ejemplo, cuando se pronostican las cifras de crecimiento para el país

o cuando se realizan apuestas por escenarios futuros o se quiere predecir alguna

variable de interés para la empresa.

Figura N° 1. Regresión lineal simple.


Fuente: https://bit.ly/2NBirKv
4 Apunte de clase

II. Relación entre las variables

En la vida cotidiana y laboral se observa la existencia de una relación entre dos o

más variables. Cuando se estudia la relación entre dos variables es muy común

realizarlo a través de un gráfico de dispersión, pues permite visualizar la relación

entre las variables. Pero además del gráfico se necesitan medidas numéricas que

interpreten la relación entre las variables. A esto se le denomina análisis de

correlación.

Ejemplo:

Una empresa dedicada a la venta de servicios quiere hacer un estudio con la

repercusión que tiene el uso de internet en el horario laboral según la edad del

trabajador.

Tabla N° 1. Ejemplo análisis de regresión.


Fuente: Material elaborado para la asignatura. Guerra, G. (2020).
5 Apunte de clase

Se quiere analizar si existe alguna relación entre la edad del trabajador y el

número de horas conectado a internet.

30

25

20

15

10

0
0 10 20 30 40 50 60

Gráfico N° 1. Gráfica de dispersión análisis de correlación.


Fuente: Material creado para la asignatura. Guerra, G. (2020).

Al observar la gráfica se puede ver que a menor edad aumenta el número de

horas de conexión a Internet en la semana. También se puede deducir que hay

una relación inversa entre las variables, pero para poder determinar la fuerza de la

relación entre las variables se debe determinar el coeficiente de correlación.

El coeficiente de correlación, creado por Karl Pearson alrededor de 1900, describe

la fuerza de la relación entre dos conjuntos de variables en escala de intervalo o

de razón. Se designa con la letra 𝑟, y con frecuencia se le conoce como 𝑟 de

Pearson y coeficiente de correlación producto-momento. Puede adoptar cualquier

valor de -1.00 a +1.00, inclusive. Un coeficiente de correlación de -1.00 o bien de

+1.00 indica una correlación perfecta.


6 Apunte de clase

Si no hay ninguna relación entre los dos conjuntos de variables, la r de Pearson es

cero. (Lind, D., Marchal, W, y Wathen, S., 2008, p. 465)

Gráfico N° 2. Diagramas de dispersión con correlación negativa y positiva


perfecta.
Fuente: Lind, D., Marchal, W, y Wathen, S. (2008). Estadística Aplicada a los Negocios y Economía. 15ª
edición. p. 465. Editorial Mc Graw Hill, México.

Figura N° 2. Resumen de la fuerza y dirección del coeficiente de correlación.


Fuente: Lind, D., Marchal, W, y Wathen, S. (2008). Estadística aplicada a los negocios y economía. 15ª
edición. p. 465. Editorial Mc Graw Hill, México.

Coeficiente de correlación:

𝑺𝒙𝒚
𝒓=
𝑺𝒙 ∙𝑺𝒚
7 Apunte de clase

En el ejemplo:

Tabla N° 2. Ejemplo coeficiente de correlación.


Fuente: Material elaborado para la asignatura. Guerra, G. (2020).

Se utilizarán las siguientes fórmulas covarianzas y desviación estándar.

∑ 𝑥𝑦 ∑ 𝑥2 2 ∑ 𝑦2 2
𝑆𝑥𝑦 = − 𝑥∙𝑦 S𝑥 = √ −𝑥 S𝑦 = √ −𝑦
𝑛 𝑛 𝑛

Covarianza:

8547
𝑆𝑥𝑦 = − (38,471 ∙ 14,118) = − 40,369
17
8 Apunte de clase

Desviación estándar de x:

26792
S𝑥 = √ − 38,4712 = 9,797
17

Desviación estándar de y:

3740
S𝑦 = √ − 14,1182 = 4,548
17

Coeficiente de correlación:

−40,369
𝑟= = − 0,906
9,797 ∙ 4,548

El coeficiente de correlación entre las variables es negativo, lo que indica que hay

una relación inversa entre ambas variables, lo que verifica lo entregado por el

gráfico de dispersión. Además, el valor de 𝑟 indica que la correlación es negativa y

fuerte. Hay que considerar que en el cálculo manual al no usar todos los

decimales puede variar un poco al realizarlo con la herramienta análisis de datos

de Excel y además que Excel entrega el valor siempre en positivo, por lo tanto, es

importante observar el signo de la pendiente de la recta y/o de la covarianza.

Figura N° 3. Resumen de datos análisis de regresión con Excel.


Fuente: Material elaborado para la asignatura. Guerra, G. (2020).
9 Apunte de clase

III. Regresión lineal simple

El análisis de regresión tiene relación con el estudio de dependencia entre las

variables. La variable dependiente “y” puede depender de una o más variables

independientes o explicativas “x”. El objetivo del análisis de regresión es

determinar una ecuación de regresión que permita realizar un pronóstico de la

variable “y” basado en otra variable “x”.

Regresión lineal con dos variables

La regresión lineal con dos variables o regresión lineal simple establece que la

variable y está en función de solo una variable x.

𝒀 = 𝜷𝟎 + 𝜷𝟏 𝑿 + 𝝁

Donde:

𝛽0 = parámetro constante del modelo

𝛽1 = pendiente de la ecuación poblacional

𝜇 = término de error o perturbación del modelo

La ecuación de regresión estimada es:

̂𝟎 + 𝜷
̂=𝜷
𝒀 ̂ 𝟏𝑿
10 Apunte de clase

Método de mínimos cuadrados ordinarios

El método de mínimos cuadrados ordinarios se atribuye a Carl Friedrich Gauss,

matemático alemán.

El objetivo de este método es encontrar la mejor recta que represente la relación

lineal entre las variables, el cual minimiza el error.

Se conoce como “recta del mejor ajuste” (Lind, D., 2008, p. 478).

El método de mínimos cuadrados ordinarios (MCO) permite determinar los

mejores estimadores insesgados.

̂𝟎 + 𝜷
̂=𝜷
𝒀 ̂ 𝟏𝑿

𝑺𝒙𝒚
̂𝟏 =
𝜷
𝑺𝟐𝒙

̂𝟎 = 𝒚 − 𝜷
𝜷 ̂ 𝟏𝒙

Usando el mismo ejemplo de las horas de conexión a internet semanal con la

edad del trabajador.


11 Apunte de clase

Teníamos que la covarianza es -40,369

26792
La varianza de x es: − 38,4712 = 95,982
17

Por lo tanto, la pendiente:

−𝟒𝟎, 𝟑𝟔𝟗
̂𝟏 =
𝜷 = − 𝟎, 𝟒𝟐
𝟗𝟓, 𝟗𝟖𝟐

El coeficiente de posición:

̂ 𝟎 = 𝟏𝟒, 𝟏𝟏𝟖 − (−𝟎, 𝟒𝟐 ∙ 𝟑𝟖, 𝟒𝟕𝟏) = 𝟑𝟎, 𝟐𝟕𝟔


𝜷
12 Apunte de clase

La recta de regresión es:

̂ = 𝟑𝟎, 𝟐𝟕𝟔 − 𝟎, 𝟒𝟐𝑿


𝒀

Estime las horas conectadas a internet en una semana de una persona de 35

años

̂ = 𝟑𝟎, 𝟐𝟕𝟔 − 𝟎, 𝟒𝟐 ∙ 𝟑𝟓 = 𝟏𝟓, 𝟓𝟕𝟔 ≈ 𝟏𝟔 horas semanales.


𝒀

Modelo de regresión con Excel

Excel cuenta con una herramienta en análisis de datos llamada “regresión”, que

realiza todas las operaciones realizadas anteriormente en el ejemplo.

Se siguen los siguientes pasos:

1) Se hace clic en datos y luego en análisis de datos

2) Se selecciona “regresión”.

3) En el rango y se colocan los datos de la variable dependiente y en el rango

x los de la variable independiente.


13 Apunte de clase

Viene predefinido con nivel de confianza 95% (se puede cambiar). Y en

rango de salida se coloca la celda donde queremos que se muestre la

información.

4) Se puede observar que Excel entrega un cuadro resumen con todos los

cálculos realizados anteriormente y con la estimación de los parámetros.


14 Apunte de clase

IV. Bibliografía

Anderson, D., Sweeney, D. y Williams, T. (2008). Estadística para administración y

economía. 10ª. edición. México: Cengage Learning.

Devore, J. (2008). Probabilidad y estadística para ingeniería y ciencias. México:

International Thomson Editores.

Lind, D., Marchal, W. y Wathen, S. (2012). Estadística aplicada a los negocios y

Economía. 15ª. edición. México: McGraw Hill.

Walpole, R., Myers, R., Myers, S. y Ye, K. (2012). Probabilidad y estadística para

ingeniería y ciencias. 9ª. edición. México: Pearson Educación.

Si usted desea referenciar este documento, considere la siguiente

información:

Guerra, G. (2020). Regresión lineal. Apunte de clase semana 6, Estadística y

Probabilidades, Universidad UNIACC


15 Apunte de clase

También podría gustarte