Analisi de Regresion
Analisi de Regresion
Analisi de Regresion
el valor de una variable) variable dependiente) dado el valor de otra variable asociada (variable Independiente). Pasos para el anlisis de regresin Lineal. 1.- Identificar las variables en estudio. X= variable Independiente Y= Variable Dependiente. 2.- Calcular el coeficiente de Correlacin: Mide el grado de relacin lineal entre las dos variables en estudio. ( -1 r 1)
3.- Calcular el coeficiente de Determinacin: Mide el porcentaje de variabilidad en y que puede ser explicado por la variable x. (determina en que porcentaje es determinada la variable dependiente) r2=r2 4.- Calcular la Ecuacin de regresin (mtodo de mnimos cuadrados ordinarios): Tiene la finalidad de encontrar la recta que mejor aproxime o ajuste al conjunto de datos. = b0 + b1x
5.- Calcular los pronsticos (estimacin): Consiste en pronosticar la variable y con la ecuacin de regresin lineal. Si x=? Entonces = b0 + b1x=?
Ejemplo: Realiza un anlisis de regresin Lineal de la relacin que existe entre los precios de nuevo tipo de jabn y la cantidad que se vender de este en una muestra de ocho das segn un estudio de mercado. Comandos a Utilizar Datos, Herramientas de datos, personalizar barra de herramientas de acceso rpido, Complementos, Herramientas para anlisis, ir, Herramientas para anlisis, aceptar, Regresin)
Precio 6 8 10 11 13 15 16 17 x= Cantidad Vendida 95 87 78 72 70 60 52 50 y=
xy=
x2=
y2=
Paso 1.- Identificar las variables en estudio. X= variable Independiente Y= Variable Dependiente. Paso 2.- Calcular el coeficiente de Correlacin: ( -1 r 1)
Paso 3.- Calcular el coeficiente de Determinacin: r2=r2 Paso 4.- Calcular la Ecuacin de regresin (mtodo de mnimos cuadrados ordinarios): = b0 + b1x
Paso 5.- Calcular los pronsticos (estimacin): Cual ser la cantidad vendida si el precio de venta es de 12 Si x=? Entonces = b0 + b1x=?
Ejercicio: Realiza un anlisis de regresin Lineal de la relacin que existe entre los precios de consulta de una psicloga y la cantidad de pacientes atendidos en una muestra de ocho meses segn un estudio de mercado. (Comandos a Utilizar Datos, Herramientas de datos, personalizar barra de herramientas de acceso rpido, Complementos, Herramientas para anlisis, ir, Herramientas para anlisis, aceptar, Regresin)
Precio 200 250 280 320 360 380 400 420 x= Pacientes Atendidos 42 37 28 25 23 21 19 15 y=
Paso 1.- Identificar las variables en estudio. Paso 2.- Calcular el coeficiente de Correlacin: ( -1 r 1) Paso 3.- Calcular el coeficiente de Determinacin: Paso 4.- Calcular la Ecuacin de regresin (mtodo de mnimos cuadrados ordinarios): Paso 5.- Calcular los pronsticos (estimacin): Cuantos pacientes atender si el precio de la consulta es de 350.
CALCULO DE ESTIMADORES
POBLACIN: Es el conjunto que incluye el total de elementos en estudio. (La medida que lo describe se llama parmetro) MUESTRA: Es un subconjunto de datos de una poblacin, seleccionados mediante procedimientos aleatorios (al azar) para obtener la representatividad. (La medida que lo describe se llama Estadstico)
ESTIMACION: Es un procedimiento de la estadstica mediante el cual se realizan clculos con los datos de una muestra para obtener valores o resultados que describan caractersticas de una poblacin. ESTIMACION PUNTUAL: Es el procedimiento mediante el cual se realizan clculos con los datos de una muestra cuyo resultado es una valor numrico nico que se utiliza para estimar el valor del parmetro poblacional.
1. Media: Es la medida de localizacin central de un conjunto de datos, tambin conocida como media aritmtica. a. Media Poblacional.
b. Media Muestra: 2. Varianza Es una medida que toma en cuenta la dispersin de cada valor con respecto a su media elevada al cuadrado. a. Poblacional. b. Muestra
3. Desviacin Estndar: Medida de dispersin que se obtiene por la raz cuadrada de la varianza a. Poblacional. b. Muestra
4. Proporcin: Es una parte, fraccin o porcentaje de los elementos que constituyen a una poblacin o una muestra. a. Muestra y poblacin
Ejemplo 1: Una empresa ha tomado una muestra del tiempo en horas que se usa diariamente 4 maquinas: 4.3, 5.9, 3.2 y 5.3. En la empresa existe un total de 11 maquinas cuyos tiempos en horas usadas fueron: 4.3, 6.1, 5.9, 3.2, 6.7, 5.3, 5.9, 6.2, 4.3, 5,4 y 6.9. Calcula la media, varianza, desviacin estndar y la proporcin de tiempo mayores de 4 horas (Parmetros y Estadsticos) y calcula el error de estimacin de las medidas descriptivas en trminos absolutos y relativos. Parmetro Media Varianza Desviacin Estndar Proporcin Ejemplo 2: En una micro empresa trabajan solo 18 trabajadores cuyos salarios por hora son: 20, 26, 25, 24, 21, 26, 27, 25, 23, 24, 26, 27, 21, 20, 22, 26, 28, 25. Si se toma una muestra aleatoria de 5 trabajadores (20, 23, 27, 26 y 25), calcula la media, varianza, desviacin estndar y la proporcin de trabajadores que ganan menos de 23 por hora (parmetros y estadsticos) y calcula el error de estimacin de las medidas descriptivas en trminos absolutos y relativos.(Comandos a Utilizar Formulas, Insertar funcin, Estadsticas, PROMEDIO, VAR, VARP, DESVEST, DESVESTP) Parmetro Media Varianza Desviacin Estndar Proporcin Ejercicio: Los nacimientos en Mxico (en miles) para cada Estado de la Republica son: 26.2, 65.1, 13.9, 17.9, 58.5, 12.6, 157.3, 82.6, 160.0, 39.7, 129.2, 103.9, 64.2, 156.9, 339.1, 106.9, 37.4, 24.7, 91.0, 118.1, 167.6, 41.6, 28.9, 59.3, 61.7, 56.1, 74.9, 27.4, 185.2, 38.9, 35.6. Si se toma una muestra de 8 estados de la republica cuyos datos son : , 160.0, 39.7, 129.2, 118.1, 167.6, 41.6, 56.1 y 74.9. Calcula la media, varianza, desviacin estndar y la proporcin de los estados que que tiene mas de 100 nacimientos (parmetros y estadsticos) y calcula el error de estimacin de las medidas descriptivas en trminos absolutos y relativos. .(Comandos a Utilizar Formulas, Insertar funcin, Estadsticas, PROMEDIO, VAR, VARP, DESVEST, DESVESTP) Parmetro Media Varianza Desviacin Estndar Proporcin Estadstico Error de estimacin % Estadstico Error de estimacin % Estadstico Error de estimacin %
Objetivo general del curso: El Estudiante aplicara mediante hoja de clculo (Excel) mtodos estadsticos para determinar las caractersticas de una muestra y una poblacin, adems efectuar diversas pruebas que contrasten los valores de los parmetros y establecer y pronosticara el comportamiento de variables econmicas, buscando una mejor toma de decisiones en su entorno econmico. TEMAS Y SUBTEMAS. 1. Calculo de Estimadores. 2.1 Tipos de estimadores, 2.2 Estimadores Puntuales, 2.3 estimadores por intervalos de confianza para la media, proporciones y para varianzas para muestras grandes y para muestras pequeas. 2.4 Estimadores por intervalo de confianza para las diferencias de dos medias y proporciones para muestras grandes y pequeas, 2.5 Aplicaciones en software (Excel) para la solucin de casos. 2. 3. Anlisis de varianza. 3.1 Anlisis de varianza de una va 3.2 Anlisis de varianza de dos vas, 3.3 Aplicaciones en software (Excel) para la solucin de casos. Regresin lineal y correlacin. 4.1 Regresin Lineal, 4.2 Mtodo de mnimo cuadrados ordinarios, 4.3 Estimacin de parmetros, 4.4 pruebas de Significancia, 4.5 Anlisis de residuales, 4.6 Aplicaciones en software (Excel) para la solucin de casos. 4. 5. Regresin Mltiple. 5.1 Regresin mltiple, 5.2 Estimacin de parmetros, 5.3 pruebas de Significancia, 5.4 Anlisis de residuales, 5.5 Aplicaciones en software (Excel) para la solucin de casos. Series de Tiempo. 6.1 Componentes de una serie de tiempo, 6.2 Modelo de promedios mviles, 6.3 Modelos de Suavizamiento Exponencial, 6.4 Modelo de Tendencia lineal, Modelo Estacional, 6.5 Aplicaciones en software (Excel) para la solucin de casos. 6. Nmeros ndices. 7.1 ndice Simple, 7.2 ndice Ponderados, 7.2.1 ndice de precios ponderados de Fisher, Paasche y Laspeyres, 6.5 Aplicaciones en software (Excel) para la solucin de casos. Bibliografa y y Levine David y Berenson Mark. 2006. Estadstica para Economa. Ed. Pearson Educacin. Hildebrand, David K. 1997. Estadstica aplicada a la Economa y la Administracin. Prentince Hall.
ESTIMACION POR INTERVALO DE CONFIANZA ESTIMACION POR INTERVALO: Es la estimacin que incluye un intervalo de valores posibles en el que se considera que esta incluido el parmetro. Intervalo de confianza (1 ) %: Seala el porcentaje de todos los intervalos que se pueden construir con todas las media maestrales posibles que contendrn el verdadero valor de la media poblacional. El nivel de significancia : Representa la probabilidad de que el parmetro no se encuentre considerado dentro del intervalo estimado. ESTIMACION DE LA MEDIA DE UNA POBLACION POR INTERVALO PARA MUESTRAS GRANDES. (Mayor a 30 datos)
ESTIMACIN DE LA MEDIA DE UNA POBLACIN POR INTERVALOS PARA MUESTRAS PEQUEAS. (Menores a 30 datos)
ESTIMACION POR INTERVALO DE CONFIANZA DE UNA PROPORCION y Primero necesitamos identificar si la muestra es lo suficientemente grande por medio de la regla: y El intervalo es:
Ejemplo : Una encuesta realizada sobre el salario diario en dlares a 30 personas arrojaron lo siguientes datos: 5, 8, 4, 6, 10, 0, 7, 2, 15, 8, 11, 5, 8, 10, 7, 15, 10, 14, 9, 0, 3, 0, 8, 9, 11, 5, 8, 9, 10 y 5. El estudio tambin toma una segunda muestra que es: 5, 8, 9, 5, 0, 10, 8 y 5. Muestra grande Media Desviacin Estndar Proporcin 1. Cul es el intervalo del 95% para el tiempo promedio para la muestra Grande? 2. Cul es el intervalo del 98% para el tiempo promedio para la muestra pequea? 3. Cul es el intervalos del 90% para la proporcin de salarios mayor a 6 dlares? Ejercicio: Los nacimientos en Mxico (en miles) para una muestra de 30 Estado de la Republica son: 26.2, 65.1, 13.9, 17.9, 58.5, 12.6, 157.3, 82.6, 160.0, 39.7, 129.2, 103.9, 64.2, 156.9, 339.1, 24.7, 91.0, 118.1, 167.6, 41.6, 28.9, 59.3, 61.7, 56.1, 74.9, 27.4, 185.2, 38.9, 35.6 y 56.3 Si se toma una muestra de 10 estados de la republica cuyos datos son: 160.0, 39.7, 129.2, 118.1, 167.6, 41.6, 56.1, 74.9, 26.2 y 65.1. 1. Cul es el intervalo del 90% para la calificacin promedio para la muestra Grande? 2. Cul es el intervalo del 98% para la calificacin promedio para la muestra pequea? 3. Cul es el intervalos del 90% para la proporcin mayor de 80 nacimientos? Muestra grande Media Desviacin Estndar Proporcin Muestra pequea Muestra pequea
ANALISIS DE VARIANZA. ANALISIS DE VARIANZA (ANOVA): Es un mtodo estadstico creado para probar la hiptesis de que las medias aritmticas de dos o ms grupos poblacionales son iguales y se fundamenta en el estudio de la varianza. Para que el anlisis de varianza tenga validez es necesario que se cumplan los siguientes supuestos: y Aleatoriedad: Significa que cada elemento es elegido aleatoriamente (al azar) y Independencia: Los resultados de un grupo no interfieren en los resultados de otro grupo. y Normalidad: Las variables de inters se distribuyen en forma normal. y Homoscedasticidad: Las variables de los grupos son semejantes. A) ANALISIS DE VARIANZA DE UNA VIA. Pasos para el anlisis de varianza de una va. 1. Elaborar una tabla de datos por grupo. 2. Establecer la hiptesis nula y la alterna. H0:1= 2= n H1: Al menos una es diferente. 3. Calcular las medias de los tratamientos (grupos) y la media global. Media de cada Grupo:
Media Global: 4. Llenar la tabla de ANOVA con los clculos requeridos. Fuentes de Grados de Suma de Cuadrados Fc variacion Libertad cuadrados Medios (Varianza) Entre grupos c-1 VET CME Fc Intra grupos n-c SCDDT CMI Total n-1 SCD Donde: C= Numero de grupos n= Numero Total de datos VET (variabilidad entre tratamientos o grupos) o suma de cuadrado entre tratamientos. Grupos G Grupo 1 Grupo 2 Grupo n SCD ( Suma de Cuadrado de las desviaciones) o Variabilidad Total.
CME (cuadrado medio entre grupos) CMI (cuadrado medio intra grupos) Fc ( F calculada)
5. Calcular F de Tablas. a) Definimos el nivel de significancia =0.05 (Error tipo I) b) La primera fila de la tabla corresponde al nmero de grados de libertad del numerador (c -1) c) La primera columna localiza el numero de grados de libertad del denominador (n c) d) La interseccin entre columnas y filas es el valor de F de tablas. 6. Tomar la decisin de Aceptar o rechazar la hiptesis nula. Reglas de decisin. Se Acepta H0 si Fc < Ftablas Se rechaza H0 si Fc Ftablas Ejemplo 1: Una empresa fabricante de bebidas embotelladas desea sacar a la venta tres nuevos sabores de refrescos, para esto se dan pruebas de refrescos a las personas que pasan en 5 tiendas comerciales diferentes y se les pregunta si les agradara que estos salieran al mercado. Los porcentajes de la gente que respondi que si en relacin con todos los encuestados se muestran en la tabla. Realiza un anlisis de varianza para verificar que los porcentajes son similares Wal-Mart Aurera Soriana Comercial Mexicana Chedraui Refresco 1 Refresco 2 Refresco 3 57 73 78 55 50 59 63 71 60 67 72 50 57 50 70
Paso 1: Elaborar una tabla de datos por grupo. Paso 2: Establecer la hiptesis nula y la alterna. Paso 3: Calcular las medias de los tratamientos (grupos) y la media global. Paso 4: Llenar la tabla de ANOVA con los clculos requeridos. Fuentes de Grados de Libertad Suma de cuadrados Cuadrados Medios variacion (Varianza)
Fc
CME CMI
Fc
VET (variabilidad entre tratamientos o grupos) o suma de cuadrado entre tratamientos. Grupos Grupo 1 Grupo 2 Grupo 3 G
y y y y y
SCDDT(Variabilidad intra grupo o dentro del grupo). SCDDT= SCD VET CME (cuadrado medio entre grupos) CMI (cuadrado medio intra grupos) Fc ( F calculada)
Paso 5: Calcular F de Tablas. a) Definimos el nivel de significancia =0.05 (Error tipo I) b) La primera fila de la tabla corresponde al nmero de grados de libertad del numerador (c -1) c) La primera columna localiza el numero de grados de libertad del denominador (n - c) d) La interseccin entre columnas y filas es el valor de F de tablas. Paso 6: Tomar la decisin de Aceptar o rechazar la hiptesis nula. Reglas de decisin. Se Acepta H0 si Fc < Ftablas Se rechaza H0 si Fc Ftablas
Ejercicio: Verifica con una anlisis de varianza si las ventas promedio mensual de tres vendedores de una empresa son similar, tomando una muestra en miles de pesos de las ventas mensuales. (Comandos a Utilizar Datos, Herramientas de datos, personalizar barra de herramientas de acceso rpido, Complementos, Herramientas para anlisis, ir, Herramientas para anlisis, aceptar, Anlisis de varianza de un Factor) Vendedor 1 25 24 23 21 25 24 Vendedor 2 28 21 20 23 24 21 Vendedor 3 29 14 21 25 28 20