Encargo Académico 02 - Grupo 2
Encargo Académico 02 - Grupo 2
Encargo Académico 02 - Grupo 2
Selección de Variables
El número de variables debe ser seleccionado de manera que no se genere un
sobreajuste del modelo (cálculo de muchos Betas) ni falte información relevante para el
estudio realizado, lo cual generaría un mayor sesgo y un menor poder predictivo.
(Baíllo, 2022).
Las variables seleccionadas deben estar basadas en dos conceptos fundamentales:
- Teoría: En el caso de que se esté utilizando una variable dependiente
económica, la selección debe realizarse de manera que esté sustentada por la
teoría. Por ejemplo: Si se desea realizar una regresión Lineal en base a la
variable PBI, este debe estar en función del consumo, balanza comercial, tipo de
cambio, nivel de impuestos, entre otros, este tipo de modelos han sido bastante
discutidos durante muchos años y se puede encontrar bastante información en
papers especializados. (El ejemplo propuesto fue realizado en base a nuestros
conocimientos personales.)
- Correlación: En caso se esté realizando una regresión Lineal en base a una
variable que se pueda tener dentro de una empresa como el nivel de ventas, uno
de los indicadores más confiables es el coeficiente de correlación, debido a que
este debe ser elevado entre la variable dependiente y las variables independiente,
sin embargo, se debe cuidar que exista un nivel elevado de correlación entre las
variables independientes, debido a que se puede generar el problema de
multicolinealidad. (La explicación realizada se ha dado en base a nuestros
conocimientos personales.)
predicción y el dato real, mientras que este esté más cercano a 1, significa que el
modelo tiene un alto nivel de exactitud, sin embargo, se puede hablar de
sobreajuste del modelo cuando se tienen valores muy cercanos a 1. (MathWorks,
2024)
- Error Cuadrático Medio (MSE): Es la media de los errores de
estimación al cuadrado, es un indicador bastante popular, debido a que pondera
en mayor medida a los errores más grandes que a los pequeños y al igual que el
R cuadrado, muestra la precisión del modelo. (Statdeveloper, 2023)
- Error medio absoluto (MAE): Es La media del valor absoluto de los
errores, es una medida popular, debido a su simpleza para interpretar, sin
embargo, al ser un promedio, no pondera de manera diferente los errores grandes
y los pequeños. (Statdeveloper, 2023)
Aplicación
Aplicación 1: Aplicación del análisis de regresión lineal simple para la estimación de
los precios de las acciones de Facebook, Inc (Brenes Gonzáles, 2017).
- Se utilizó la regresión simple para poder buscar una relación entre la variable
dependiente (Precio mensual de las acciones) y la variable independiente
(tiempo expresado en meses).
- Se determinó que existe una relación lineal positiva entre la variable dependiente
e independiente, sin embargo, no se realizó el análisis de los residuos para ver si
distribuían normal y el modelo pueda ser utilizado para realizar la predicción.
- De acuerdo con las conclusiones del artículo, logró hacer una predicción de 10
meses en el futuro, indicando que el precio promedio sería de 170 dólares.
- El indicador de bondad de ajuste R cuadrado indica 0.966, lo cual va en relación
con el alto nivel de correlación que se mostraba entre la variable dependiente e
independiente.