Final Ep4
Final Ep4
Final Ep4
library(haven)
library(survey)
##
## Attaching package: ’survey’
library(tidyverse)
library(readxl)
library(knitr)
library(kableExtra)
##
## Attaching package: ’kableExtra’
1
#------------------
library(mctest)
library(lmtest)
##
## Attaching package: ’zoo’
library(foreign)
library(ggplot2)
library(strucchange)
##
## Attaching package: ’strucchange’
library (dplyr)
library(car)
##
## Attaching package: ’car’
2
library(olsrr)
##
## Attaching package: ’olsrr’
#-------------------------------------*
options(scipen=999)
#-------------------------------------*
#dir.ubigeo <- "E:\\OneDrive - Universidad de San Martin de Porres\\Datos\\UBIGEO_2019.xlsx" #file.choos
maindir <- "C:/Users/Bryant Omar/Desktop/FINAL EP4"
#-------------------------------------*
#RUTAS DE TRABAJO
#-------------------------------------*
subdir.caract_UA1 <- c("/701-Modulo1529/01_Cap100_1.sav")
subdir.caract_UA2 <- c("/701-Modulo1529/01_Cap100_2.sav")
subdir.caract_financieras <- c("/701-Modulo1545/17_Cap900.sav")
#----*
subdir.sup_cosech <- c("/701-Modulo1530/02_Cap200ab.sav")
subdir.costo_cosech <- c("/701-Modulo1536/08_Cap200e.sav")
subdir.prod_cosech <- c("/701-Modulo1533/05_Cap200b.sav")
subdir.costo_produccion <- c("/701-Modulo1546/18_Cap1000.sav")
subdir.sup_cultivada <- c("/701-Modulo1549/21_Cap1200a.sav")
subdir.uso_tierra <- c("/701-Modulo1550/22_Cap1200a_1.sav")
colnames(CAR_UA1)
3
## [21] "P102_2" "P102_3" "P102A_MES" "P102A_ANIO" "P102B"
## [26] "P103" "P103_EE" "P103_N" "P104_SUP_1" "P104_SUP_2"
## [31] "P104_UM" "P104_COD" "P104_EQUIV_1" "P104_EQUIV_2" "P104_SUP_ha"
## [36] "P229B" "P229F" "P242_1" "P242_2" "P242_3"
## [41] "P242_4" "P410A" "P418"
colnames(CAR_UA2)
#HALLANDO DUPLICADOS
dim(CAR_UA1) #dimensiones de una matriz de datos
## [1] 1180 43
## [1] 5568 46
#------------
temp_1 <- dim(CAR_UA1 %>% distinct(ANIO,CCDD,CCPP,CCDI,CONGLOMERADO,NSELUA,UA))
temp_2 <- dim(CAR_UA2 %>% distinct(ANIO,CCDD,CCPP,CCDI,CONGLOMERADO,NSELUA,UA))
#-------------
print(c(temp_1,temp_2))
Podemos ver que el número de unidades agropecuarias (UA) de la tabla de datos CAR_UA1 es 1180, 7 y el
número de undidades agropecuarias (UA) de la tabla CAR_UA2 es 1066, 7. Como CAR_UA2 tiene menos
UA, esto indica que CAR_UA2 podría ser un subconjunto de la tabla CAR_UA1. Además, se observa que
la tabla CAR_UA2 tiene más filas, esto es porque se ecuentra a nivel de parcela.
Para poder identificar cuántas veces se duplica el ID de una unidad agropecuaria (el cual está compuesto por
las variables ANIO,CCDD,CCPP,CCDI,CONGLOMERADO,NSELUA,UA) utilizamos el siguiente
código.
#HALLANDO DUPLICADOS
CAR_UA2 <- CAR_UA2 %>%
group_by(ANIO,CCDD,CCPP,CCDI,CONGLOMERADO,NSELUA,UA) %>%
mutate(dup = n()) #CREA UNA COLUMNA DE NOMBRE 'dup' QUE CUENTA EL NÚMERO DE FILAS CON LOS MIS
4
Esta técnica utilizada para identificar filas duplicadas nos permite comprender que la tabla de datos se
encuentra a nivel de parcelas, en el siguiente caso particular presentamos un productor que tiene 90 parcelas.
Es importante tener en cuenta, que en el Perú distintos agricultores pueden tener distinas maneras de
medir la superficie agrícola. Por ello, es necesario estandarizar estas cantidades a una medida convencional
como hectáreas. Utilizamos el siguiente código para calcular la equivalencia a hectáreas y posteriormente
multiplicarlo sobre el total de superficie indicado.
Se puede comparar la variable creada ‘SUP_TOTAL’ con la variable indicada por el INEI ‘P104_SUP_ha’.
sum(CAR_UA1$SUP_TOTAL,na.rm = T)
## [1] 53714.1
sum(CAR_UA1$P104_SUP_ha,na.rm = T)
## [1] 53714.1
#CREAMOS LA SIGUIENTE TABLA PARA AGREGAR LA COLUMNA 'EQUIV_TOTAL' EN LAS TABLAS NECESARIAS COMO LA DE SU
CAR_EQUIV <- CAR_UA1 %>% select(ANIO,CCDD,CCPP,CCDI,CONGLOMERADO,NSELUA,UA,EQUIV_TOTAL)
#-----------------*
sup_cosechada <- sup_cosechada %>% left_join(CAR_EQUIV,
by=c("ANIO","CCDD","CCPP","CCDI","CONGLOMERADO","NSELUA","U
#-----------------*
sup_cosechada <- sup_cosechada %>% mutate(sup_sembrada_raw=as.numeric(paste0(P210_SUP_1,".",P210_SUP_2))
sup_sembrada_ha=as.numeric(paste0(P210_SUP_1,".",P210_SUP_2))*
sup_cosechada_ha=as.numeric(paste0(P217_SUP_1,".",P217_SUP_2))
#-------------------------------------------------*
s.cultivada <- s.cultivada %>% left_join(CAR_EQUIV, by=c("ANIO","CCDD","CCPP","CCDI","CONGLOMERADO","NSE
s.cultivada <- s.cultivada %>% mutate(SUP_CULTIVADA=as.numeric(paste0(P1206_SUP_1,".",P1206_SUP_2))*EQUI
#-------------------------------------------------*
uso_tierra <- uso_tierra %>% left_join(CAR_EQUIV, by=c("ANIO","CCDD","CCPP","CCDI","CONGLOMERADO","NSELU
Ahora realizaremos algunas estadísticas descriptivas de las covariables a analizar (antes de costruir el conjunto
de datos para nuestro modelo)
Analisis de la superficie cosechada y destino de los cultivos cosechados
5
#----------------------------------------*
sup_cosechada <- sup_cosechada %>% mutate(cosechara_raw = as.numeric(paste0(P219_CANT_1,".",P219_C
destino_1_venta = as.numeric(paste0(P220_1_CANT_1,".",P220
destino_2_consumo = as.numeric(paste0(P220_2_ENT,".",P220_2_
destino_3_semilla = as.numeric(paste0(P220_3_ENT,".",P220_3_
destino_3_semilla_autoinsumo = as.numeric(paste0(P220_3A_ENT,"
destino_3_semilla_venta = as.numeric(paste0(P220_3B_ENT,"
destino_4_trueque = as.numeric(paste0(P220_4_ENT,".",P220_4_
destino_5_animales = as.numeric(paste0(P220_5_ENT,".",P220_5_
destino_6_derivados = as.numeric(paste0(P220_6_ENT,".",P220_6_
destino_7_otro = as.numeric(paste0(P220_7_ENT,".",P220_7_
destino_8_otro = as.numeric(paste0(P220_8_ENT,".",P220_8_
destino_9_otro = as.numeric(paste0(P220_9_ENT,".",P220_9_
destino_10_otro = as.numeric(paste0(P220_10_ENT,".",P220_1
#----------------------------------------*
#View(sup_cosechada %>% select(cosechara_raw,destino_3_semilla,starts_with("P220_3A"),starts_with("P220_
#----------------------------------------*
#View(sup_cosechada %>% select(cosechara_raw,starts_with("destino")))
#----------------------------------------*
sup_cosechada <- sup_cosechada %>% mutate(cosechara = as.numeric(paste0(P219_CANT_1,".",P219_CANT_2))*P2
destino_1_venta_kg=destino_1_venta*P219_EQUIV_KG*P220_1_PRE_KG
cosecho = as.numeric(paste0(P224_CANT_1,".",P224_CANT_2))*P224
#----------------*
#View(sup_cosechada %>% filter(P220_1_VAL!=destino_1_venta_kg)%>% select(destino_1_venta,destino_1_venta
#----------------------------------------*
#head(sup_cosechada %>% filter(is.na(P224_CANT_1)==F) %>% select(starts_with("P224")),10)
#------------*
6
#--------------------*
ua_produccion <- sup_cosechada %>%
group_by(ANIO,CCDD,CCPP,CCDI,CONGLOMERADO,NSELUA,UA) %>%
summarise_at(.vars = c("sup_sembrada_ha","sup_cosechada_ha","cosechara","cosecho","riego",destino_na
.funs = sum,
na.rm=T)
#--------------------*
ua_produccion <- ua_produccion %>% mutate(riego=ifelse(riego>0,1,0))
#--------------------*
ua_produccion <- ua_produccion %>% inner_join(CAR_UA1, by=c("ANIO","CCDD","CCPP","CCDI","CONGLOMERADO","
#--------------------*
ua_produccion <- ua_produccion %>%
mutate(across(.cols =
c(sup_sembrada_ha, sup_cosechada_ha,SUP_TOTAL), #VECTOR DE VARIABLES A MODIFICAR
.fns = ~case_when(.x > 0 & .x < 1 ~ "1. Menos de 1 ha",
.x >= 1 & .x < 2 ~ "2. Entre 1 y menos de 2 ha",
.x >= 2 & .x < 5 ~ "3. Entre 2 y menos de 5 ha",
.x >= 5 & .x < 10 ~ "4. Entre 5 y menos de 10 ha",
.x >= 10 & is.na(.x)==F ~ "5. Mas de 10 ha",
TRUE ~ as.character(NA)),
.names = "{.col}_cat"))
#--------------------*
ua_produccion <- ua_produccion %>% mutate(cosechara_t=cosechara/1000,
cosecho_t=cosecho/1000,
rendimiento=cosechara_t/sup_cosechada_ha)
## # A tibble: 1 x 2
## sup_cosechada_ha cosechara_t
## <dbl> <dbl>
## 1 21221. 257262.
#----------------------------------------*
par(mfrow=c(2,2))
hist(ua_produccion$rendimiento,main = "Histograma rendimiento")
hist(log(ua_produccion$rendimiento),main = "Histograma del logaritmo del rendimiento")
boxplot(ua_produccion$rendimiento,outline = T)
boxplot(ua_produccion$rendimiento,outline = F)
7
Histograma rendimiento Histograma del logaritmo del rendimiento
Frequency
Frequency
150
150
0
0
0 10 20 30 40 50 −2 −1 0 1 2 3 4
ua_produccion$rendimiento log(ua_produccion$rendimiento)
10 20
20 40
0
## # A tibble: 5 x 4
## SUP_TOTAL_cat sup_cosechada_ha cosechara_t rendimiento
## <chr> <dbl> <dbl> <dbl>
## 1 1. Menos de 1 ha 54.0 476. 8.82
## 2 2. Entre 1 y menos de 2 ha 77.3 816. 10.6
## 3 3. Entre 2 y menos de 5 ha 192. 1295. 6.75
## 4 4. Entre 5 y menos de 10 ha 229. 1412. 6.16
## 5 5. Mas de 10 ha 20668. 253262. 12.3
plot(ua_produccion$SUP_TOTAL,ua_produccion$rendimiento)
8
50
ua_produccion$rendimiento
40
30
20
10
0
ua_produccion$SUP_TOTAL
plot(log(ua_produccion$SUP_TOTAL),log(ua_produccion$rendimiento))
9
4
log(ua_produccion$rendimiento)
3
2
1
0
−1
−4 −2 0 2 4 6 8
log(ua_produccion$SUP_TOTAL)
cor.test(ua_produccion$SUP_TOTAL,ua_produccion$rendimiento)
##
## Pearson’s product-moment correlation
##
## data: ua_produccion$SUP_TOTAL and ua_produccion$rendimiento
## t = 0.9361, df = 1014, p-value = 0.3494
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
## -0.03217676 0.09072304
## sample estimates:
## cor
## 0.02938419
10
design = svy_ua_produccion,
FUN = svyratio)
## SUP_TOTAL_cat
## 1. Menos de 1 ha 1. Menos de 1 ha
## 2. Entre 1 y menos de 2 ha 2. Entre 1 y menos de 2 ha
## 3. Entre 2 y menos de 5 ha 3. Entre 2 y menos de 5 ha
## 4. Entre 5 y menos de 10 ha 4. Entre 5 y menos de 10 ha
## 5. Mas de 10 ha 5. Mas de 10 ha
## cosechara_t/sup_cosechada_ha
## 1. Menos de 1 ha 8.293887
## 2. Entre 1 y menos de 2 ha 9.542421
## 3. Entre 2 y menos de 5 ha 5.504476
## 4. Entre 5 y menos de 10 ha 5.735255
## 5. Mas de 10 ha 14.012611
## se.cosechara_t/sup_cosechada_ha
## 1. Menos de 1 ha 0.5961282
## 2. Entre 1 y menos de 2 ha 0.9385284
## 3. Entre 2 y menos de 5 ha 0.5086327
## 4. Entre 5 y menos de 10 ha 1.2490285
## 5. Mas de 10 ha 2.2607454
svyby(formula = ~cosechara_t,
denominator = ~sup_cosechada_ha,
by=~riego,
design = svy_ua_produccion,
FUN = svyratio)
11
#-----------------------------------------------*
ua_produccion <- ua_produccion %>% left_join(ua_cosech,by=c("ANIO","CCDD","CCPP","CCDI","CONGLOMERADO","
#----------------------------------------*
svyby(formula = ~cosechara_t,
denominator = ~sup_cosechada_ha,
by=~uso_fertilizante,
design = svy_ua_produccion,
FUN = svyratio)
INTERPRETACIÓN: Se observa que los que no usan fertilizante obtienen un rendimiento de 13.03 aproxi-
madamente. Mientras los que usan fertilizante obtendrán un rendimiento de 13.42 aproximadamente.
svyby(formula = ~cosechara_t,
denominator = ~sup_cosechada_ha,
by=~uso_plaguicida,
design = svy_ua_produccion,
FUN = svyratio)
INTERPRETACIÓN: Se observa que los que no usan plaguicida obtienen un rendimiento de 12.34 aproxi-
madamente. Mientras los que usan plaguicida obtendrán un rendimiento de 14.78 aproximadamente.
——————————————————————————
#-------------------------------------------------
#Verificación de NA: table(caract_financieras$uso_credito,useNA="ifany")
#-------------------------------------------------
ua_credito <- caract_financieras %>%
group_by(ANIO,CCDD,CCPP,CCDI,CONGLOMERADO,NSELUA,UA) %>%
summarise(uso_credito=max(uso_credito, na.rm = T))
#-----------------------------------------------------------------
ua_produccion <- ua_produccion %>% left_join(ua_credito,by=c("ANIO","CCDD","CCPP","CCDI","CONGLOMERADO",
12
svy_ua_produccion <- svydesign(ids = ~1, weights = ~FACTOR, data = ua_produccion)
#----------------------------------------*
svyby(formula = ~cosechara_t,
denominator = ~sup_cosechada_ha,
by=~uso_credito,
design = svy_ua_produccion,
FUN = svyratio)
INTERPRETACIÓN: Se observa que los que no usan credito obtienen un rendimiento de 12.72 aproximada-
mente. Mientras los que usan credito obtendrán un rendimiento de 16.27 aproximadamente.
——————————————————————————
1. ANÁLISIS DESCRIPTIVO
VARIABLE DEPENDIENTE: Es aquella varirable que depende de variables independientes para aumentar
o reducir en cantidad. En el caso presente, nuestra variable dependiente es el Rendimiento.
VARIABLES INDEPENDIENTES: Son aquellas variables que no dependen de un factor externo, sino que
mas bien determinan el valor de una dependiente.
a.Modelo 1
13
modelo1 <- lm(rendimiento~ uso_fertilizante
+uso_plaguicida
+uso_credito
+riego
+SUP_TOTAL
+gasto_fertilizante
+gasto_plaguicida
+gasto_semilla
+gasto_abono ,
data = datos_finales_1)
summary(modelo1)
##
## Call:
## lm(formula = rendimiento ~ uso_fertilizante + uso_plaguicida +
## uso_credito + riego + SUP_TOTAL + gasto_fertilizante + gasto_plaguicida +
## gasto_semilla + gasto_abono, data = datos_finales_1)
##
## Residuals:
## Min 1Q Median 3Q Max
## -19.333 -5.243 -1.713 2.428 37.714
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 7.14089855 0.43085031 16.574 < 0.0000000000000002 ***
## uso_fertilizante -0.17832292 0.73002653 -0.244 0.8071
## uso_plaguicida 3.00292658 0.72998451 4.114 0.00004212 ***
## uso_credito 3.97580189 0.83939672 4.736 0.00000249 ***
## riego 1.17569382 0.60321631 1.949 0.0516 .
## SUP_TOTAL 0.00092345 0.00067803 1.362 0.1735
## gasto_fertilizante -0.00006033 0.00006681 -0.903 0.3668
## gasto_plaguicida 0.00006929 0.00003653 1.897 0.0582 .
## gasto_semilla 0.00098522 0.00041004 2.403 0.0165 *
## gasto_abono -0.00004298 0.00004353 -0.987 0.3237
## ---
## Signif. codes: 0 ’***’ 0.001 ’**’ 0.01 ’*’ 0.05 ’.’ 0.1 ’ ’ 1
##
## Residual standard error: 8.156 on 1006 degrees of freedom
## Multiple R-squared: 0.08695, Adjusted R-squared: 0.07878
## F-statistic: 10.64 on 9 and 1006 DF, p-value: 0.0000000000000007006
INTERPRETACIÓN:
Asumiendo que el modelo esta correctamente especificado (se cumplen todos los supuestos) podemos inferir
que:
• En el presente modelo de regresión se visualiza que si las variables independientes son 0, entonces el
rendimiento por hectarea aumenta en 714% gracias al intercepto.
• Un cambio en la variable “uso_fertilizante” tiene un efecto negativo del 17.8% sobre el rendimiento por
hectarea.
• Un cambio en los años de “uso_plaguicida” en una unidad tiene un efecto positivo del 300%% sobre el
rendimiento por hectarea.
14
• Un cambio en los años de “uso_credito” en una unidad tiene un efecto positivo del 398%% sobre el
rendimiento por hectarea.
• Un cambio en los años de “riego” en una unidad tiene un efecto positivo del 118% sobre el rentimiento
por hectarea.
• Un cambio en la variable “SUP_TOTAL” en una unidad tiene un efecto positivo del 0.09% sobre el
rendimiento por hectarea.
• Un cambio en los años de “gasto_fertilizante” en una unidad tiene un efecto negativo del 0.006% sobre el
rendimiento por hectarea.
• Un cambio en los años de “gasto_plaguicida” en una unidad tiene un efecto positivo del 0.007% sobre el
rendimiento por hectarea.
• Un cambio en el número de “gasto_semilla” en una unidad tiene un efecto positivo del 0.1% sobre el
rendimiento por hectarea.
• Un cambio en el número de “gasto_abono” en una unidad tiene un efecto negativo del 0.004% sobre el
rendimiento por hectarea.
b. Modelo 2
##
## Call:
## svyglm(formula = rendimiento ~ uso_fertilizante + uso_plaguicida +
## uso_credito + riego + SUP_TOTAL + gasto_fertilizante + gasto_plaguicida +
## gasto_semilla + gasto_abono, design = svy_datos_finales,
## family = gaussian(link = "identity"))
##
## Survey design:
## svydesign(ids = ~1, weights = ~FACTOR, data = datos_finales_2)
15
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 5.79631429 0.44313178 13.080 < 0.0000000000000002 ***
## uso_fertilizante 0.99869245 0.94530298 1.056 0.2910
## uso_plaguicida 1.84259658 0.93958437 1.961 0.0501 .
## uso_credito 2.43591013 1.03437371 2.355 0.0187 *
## riego 2.51827069 0.53531334 4.704 0.0000029 ***
## SUP_TOTAL 0.00658744 0.00340150 1.937 0.0531 .
## gasto_fertilizante -0.00016759 0.00018260 -0.918 0.3589
## gasto_plaguicida 0.00005455 0.00010955 0.498 0.6187
## gasto_semilla 0.00132185 0.00051217 2.581 0.0100 **
## gasto_abono -0.00002581 0.00008330 -0.310 0.7567
## ---
## Signif. codes: 0 ’***’ 0.001 ’**’ 0.01 ’*’ 0.05 ’.’ 0.1 ’ ’ 1
##
## (Dispersion parameter for gaussian family taken to be 58.36385)
##
## Number of Fisher Scoring iterations: 2
INTERPRETACIÓN:
Asumiendo que el modelo esta correctamente especificado (se cumplen todos los supuestos) podemos inferir
que:
• En el presente modelo de regresión se visualiza que si las variables independientes son 0, entonces el
rendimiento por hectarea aumenta en 580% gracias al intercepto.
• Un cambio en la variable “uso_fertilizante” tiene un efecto positivo del 100% sobre el rendimiento por
hectarea.
• Un cambio en los años de “uso_plaguicida” en una unidad tiene un efecto positivo del 184% sobre el
rendimiento por hectarea.
• Un cambio en los años de “uso_credito” en una unidad tiene un efecto positivo del 244% sobre el
rendimiento por hectarea.
• Un cambio en los años de “riego” en una unidad tiene un efecto positivo del 252% sobre el rentimiento
por hectarea.
• Un cambio en la variable “SUP_TOTAL” en una unidad tiene un efecto positivo del 0.7% sobre el
rendimiento por hectarea.
• Un cambio en los años de “gasto_fertilizante” en una unidad tiene un efecto negativo del 0.02% sobre el
rendimiento por hectarea.
• Un cambio en los años de “gasto_plaguicida” en una unidad tiene un efecto positivo del 0.005% sobre el
rendimiento por hectarea.
• Un cambio en el número de “gasto_semilla” en una unidad tiene un efecto positivo del 0.13% sobre el
rendimiento por hectarea.
• Un cambio en el número de “gasto_abono” en una unidad tiene un efecto negativo del 0.003% sobre el
rendimiento por hectarea.
16
plot(log(modelo1$fitted.values),log(svy_datos_finales$variables$rendimiento))
log(svy_datos_finales$variables$rendimiento)
4
3
2
1
0
−1
log(modelo1$fitted.values)
#-----------------------------------------------------------------
plot(log(modelo2$fitted.values),log(svy_datos_finales$variables$rendimiento))
17
log(svy_datos_finales$variables$rendimiento)
4
3
2
1
0
−1
log(modelo2$fitted.values)
INTERPRETACIÓN: Observando la grafica del modelo 1 y 2 se puede determinar que presenta heterocedas-
ticidad, debido a que el error no es constante presenta datos atípicos o aberrantes.
a. Modelo 1
imcdiag(modelo1)
##
## Call:
## imcdiag(mod = modelo1)
##
##
## All Individual Multicollinearity Diagnostics Result
##
## VIF TOL Wi Fi Leamer CVIF Klein IND1
## uso_fertilizante 2.0006 0.4999 125.9489 144.0845 0.7070 2.1258 1 0.0040
## uso_plaguicida 2.0034 0.4991 126.3040 144.4907 0.7065 2.1288 1 0.0040
## uso_credito 1.0307 0.9703 3.8590 4.4146 0.9850 1.0952 0 0.0077
## riego 1.0529 0.9498 6.6569 7.6155 0.9746 1.1188 0 0.0075
## SUP_TOTAL 1.0222 0.9783 2.7938 3.1961 0.9891 1.0862 0 0.0078
## gasto_fertilizante 1.5820 0.6321 73.2549 83.8030 0.7951 1.6810 1 0.0050
## gasto_plaguicida 1.6136 0.6197 77.2399 88.3619 0.7872 1.7147 1 0.0049
## gasto_semilla 1.1466 0.8722 18.4501 21.1068 0.9339 1.2184 1 0.0069
18
## gasto_abono 1.0131 0.9871 1.6476 1.8849 0.9935 1.0765 0 0.0078
## IND2
## uso_fertilizante 2.2602
## uso_plaguicida 2.2633
## uso_credito 0.1344
## riego 0.2270
## SUP_TOTAL 0.0981
## gasto_fertilizante 1.6624
## gasto_plaguicida 1.7185
## gasto_semilla 0.5777
## gasto_abono 0.0584
##
## 1 --> COLLINEARITY is detected by the test
## 0 --> COLLINEARITY is not detected by the test
##
## uso_fertilizante , riego , SUP_TOTAL , gasto_fertilizante , gasto_plaguicida , gasto_abono , coeffici
##
## R-square of y on all x: 0.0869
##
## * use method argument to check which regressors may be the reason of collinearity
## ===================================
b. Modelo 2
imcdiag(modelo2)
##
## Call:
## imcdiag(mod = modelo2)
##
##
## All Individual Multicollinearity Diagnostics Result
##
## VIF TOL Wi Fi Leamer CVIF Klein IND1
## uso_fertilizante 2.0006 0.4999 125.9489 144.0845 0.7070 2.1258 1 0.0040
## uso_plaguicida 2.0034 0.4991 126.3040 144.4907 0.7065 2.1288 1 0.0040
## uso_credito 1.0307 0.9703 3.8590 4.4146 0.9850 1.0952 0 0.0077
## riego 1.0529 0.9498 6.6569 7.6155 0.9746 1.1188 0 0.0075
## SUP_TOTAL 1.0222 0.9783 2.7938 3.1961 0.9891 1.0862 0 0.0078
## gasto_fertilizante 1.5820 0.6321 73.2549 83.8030 0.7951 1.6810 1 0.0050
## gasto_plaguicida 1.6136 0.6197 77.2399 88.3619 0.7872 1.7147 1 0.0049
## gasto_semilla 1.1466 0.8722 18.4501 21.1068 0.9339 1.2184 1 0.0069
## gasto_abono 1.0131 0.9871 1.6476 1.8849 0.9935 1.0765 0 0.0078
## IND2
## uso_fertilizante 2.2602
## uso_plaguicida 2.2633
## uso_credito 0.1344
## riego 0.2270
19
## SUP_TOTAL 0.0981
## gasto_fertilizante 1.6624
## gasto_plaguicida 1.7185
## gasto_semilla 0.5777
## gasto_abono 0.0584
##
## 1 --> COLLINEARITY is detected by the test
## 0 --> COLLINEARITY is not detected by the test
##
## uso_fertilizante , riego , SUP_TOTAL , gasto_fertilizante , gasto_plaguicida , gasto_abono , coeffici
##
## R-square of y on all x: 0.0869
##
## * use method argument to check which regressors may be the reason of collinearity
## ===================================
residuales<-modelo1$residuals
prediccion<-modelo1$fitted.values
ggplot(datos_finales_1,aes(uso_fertilizante
+uso_plaguicida
+uso_credito
+riego
+SUP_TOTAL
+gasto_fertilizante
+gasto_plaguicida
+gasto_semilla
+gasto_abono, rendimiento))+geom_point()
20
50
40
30
rendimiento
20
10
##
## Call:
## lm(formula = (residuales^2) ~ uso_fertilizante + uso_plaguicida +
## uso_credito + riego + SUP_TOTAL + gasto_fertilizante + gasto_plaguicida +
## gasto_semilla + gasto_abono, data = datos_finales_1)
##
## Residuals:
## Min 1Q Median 3Q Max
## -402.50 -60.01 -39.37 -13.16 1375.51
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 66.0752081 8.1162825 8.141 0.00000000000000115 ***
## uso_fertilizante -26.4752112 13.7521115 -1.925 0.0545 .
21
## uso_plaguicida 26.2909347 13.7513201 1.912 0.0562 .
## uso_credito 30.7373021 15.8124081 1.944 0.0522 .
## riego -18.8277819 11.3632829 -1.657 0.0979 .
## SUP_TOTAL 0.0101113 0.0127726 0.792 0.4288
## gasto_fertilizante 0.0023624 0.0012586 1.877 0.0608 .
## gasto_plaguicida 0.0009270 0.0006881 1.347 0.1782
## gasto_semilla -0.0050356 0.0077242 -0.652 0.5146
## gasto_abono -0.0002331 0.0008200 -0.284 0.7762
## ---
## Signif. codes: 0 ’***’ 0.001 ’**’ 0.01 ’*’ 0.05 ’.’ 0.1 ’ ’ 1
##
## Residual standard error: 153.6 on 1006 degrees of freedom
## Multiple R-squared: 0.02646, Adjusted R-squared: 0.01775
## F-statistic: 3.038 on 9 and 1006 DF, p-value: 0.001361
bptest(datos_finales_1$rendimiento ~ datos_finales_1$uso_fertilizante
+datos_finales_1$uso_plaguicida
+datos_finales_1$uso_credito
+datos_finales_1$riego
+datos_finales_1$SUP_TOTAL
+datos_finales_1$gasto_fertilizante
+datos_finales_1$gasto_plaguicida
+datos_finales_1$gasto_semilla
+datos_finales_1$gasto_abono)
##
## studentized Breusch-Pagan test
##
## data: datos_finales_1$rendimiento ~ datos_finales_1$uso_fertilizante + datos_finales_1$uso_plagu
## BP = 26.884, df = 9, p-value = 0.001462
INTERPRETACIÓN: A través de las pruebas de Breusch Pagan, se confirma que existe heterocedasticidad
en el modelo 1.
b. Modelo 2
residuales2 <-modelo2$residuals
prediccion2 <-modelo2$fitted.values
ggplot(svy_datos_finales$variables,aes(uso_fertilizante
+uso_plaguicida
+uso_credito
+riego
+SUP_TOTAL
+gasto_fertilizante
+gasto_plaguicida
+gasto_semilla
+gasto_abono, rendimiento))+geom_point()
22
50
40
30
rendimiento
20
10
modelo_breusch<-lm((residuales2ˆ2) ~ uso_fertilizante
+uso_plaguicida
+uso_credito
+riego
+SUP_TOTAL
+gasto_fertilizante
+gasto_plaguicida
+gasto_semilla
+gasto_abono,data = svy_datos_finales$variables)
summary(modelo_breusch)
##
## Call:
## lm(formula = (residuales2^2) ~ uso_fertilizante + uso_plaguicida +
## uso_credito + riego + SUP_TOTAL + gasto_fertilizante + gasto_plaguicida +
## gasto_semilla + gasto_abono, data = svy_datos_finales$variables)
##
## Residuals:
## Min 1Q Median 3Q Max
## -584.13 -58.18 -39.53 -18.71 1372.57
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 53.5845221 8.8717710 6.040 0.00000000217 ***
## uso_fertilizante -17.3495176 15.0322004 -1.154 0.2487
23
## uso_plaguicida 24.0828655 15.0313353 1.602 0.1094
## uso_credito 28.1240756 17.2842757 1.627 0.1040
## riego -14.2759629 12.4210123 -1.149 0.2507
## SUP_TOTAL 0.2957122 0.0139615 21.181 < 0.0000000000000002 ***
## gasto_fertilizante 0.0033814 0.0013758 2.458 0.0141 *
## gasto_plaguicida -0.0003582 0.0007522 -0.476 0.6340
## gasto_semilla -0.0024662 0.0084432 -0.292 0.7703
## gasto_abono -0.0007019 0.0008963 -0.783 0.4337
## ---
## Signif. codes: 0 ’***’ 0.001 ’**’ 0.01 ’*’ 0.05 ’.’ 0.1 ’ ’ 1
##
## Residual standard error: 167.9 on 1006 degrees of freedom
## Multiple R-squared: 0.3207, Adjusted R-squared: 0.3146
## F-statistic: 52.77 on 9 and 1006 DF, p-value: < 0.00000000000000022
bptest(svy_datos_finales$variables$rendimiento ~ svy_datos_finales$variables$uso_fertilizante
+svy_datos_finales$variables$uso_plaguicida
+svy_datos_finales$variables$uso_credito
+svy_datos_finales$variables$riego
+svy_datos_finales$variables$SUP_TOTAL
+svy_datos_finales$variables$gasto_fertilizante
+svy_datos_finales$variables$gasto_plaguicida
+svy_datos_finales$variables$gasto_semilla
+svy_datos_finales$variables$gasto_abono)
##
## studentized Breusch-Pagan test
##
## data: svy_datos_finales$variables$rendimiento ~ svy_datos_finales$variables$uso_fertilizante + s
## BP = 26.884, df = 9, p-value = 0.001462
INTERPRETACIÓN: A través de las pruebas de Breusch Pagan, se confirma que existe heterocedasticidad
en el modelo 2.
——————————————————————————
2.2.2. Corrección de los modelos (No se conocen la varianzas) a. Modelo 1
##
## Call:
## lm(formula = log(residuales^2) ~ log(uso_fertilizante + uso_plaguicida +
24
## uso_credito + riego + SUP_TOTAL + gasto_fertilizante + gasto_plaguicida +
## gasto_semilla + gasto_abono), data = datos_finales_1)
##
## Residuals:
## Min 1Q Median 3Q Max
## -12.9386 -1.0813 0.5215 1.5182 4.8429
##
## Coefficients:
##
## (Intercept)
## log(uso_fertilizante + uso_plaguicida + uso_credito + riego + SUP_TOTAL + gasto_fertilizante + gasto_
##
## (Intercept)
## log(uso_fertilizante + uso_plaguicida + uso_credito + riego + SUP_TOTAL + gasto_fertilizante + gasto_
##
## (Intercept)
## log(uso_fertilizante + uso_plaguicida + uso_credito + riego + SUP_TOTAL + gasto_fertilizante + gasto_
##
## (Intercept)
## log(uso_fertilizante + uso_plaguicida + uso_credito + riego + SUP_TOTAL + gasto_fertilizante + gasto_
##
## (Intercept)
## log(uso_fertilizante + uso_plaguicida + uso_credito + riego + SUP_TOTAL + gasto_fertilizante + gasto_
## ---
## Signif. codes: 0 ’***’ 0.001 ’**’ 0.01 ’*’ 0.05 ’.’ 0.1 ’ ’ 1
##
## Residual standard error: 2.478 on 1014 degrees of freedom
## Multiple R-squared: 0.0003615, Adjusted R-squared: -0.0006243
## F-statistic: 0.3667 on 1 and 1014 DF, p-value: 0.5449
## # A tibble: 6 x 17
## # Groups: ANIO, CCDD, CCPP, CCDI, CONGLOMERADO, NSELUA [6]
## ANIO CCDD CCPP CCDI CONGLOMERADO NSELUA rendimiento uso_fertilizante
## <dbl> <chr> <chr> <chr> <chr> <chr> <dbl> <dbl>
## 1 2019 19 01 02 10672 00018 5.28 1
## 2 2019 19 01 02 10672 00024 3.2 1
## 3 2019 19 01 02 10672 00029 6.19 1
## 4 2019 19 01 02 10672 00040 9.77 1
## 5 2019 19 01 02 10672 00053 3.02 1
## 6 2019 19 01 02 10672 00054 7 1
## # ... with 9 more variables: uso_plaguicida <dbl>, uso_credito <dbl>,
## # riego <dbl>, SUP_TOTAL <dbl>, gasto_fertilizante <dbl>,
## # gasto_plaguicida <dbl>, gasto_semilla <dbl>, gasto_abono <dbl>,
## # varianza <dbl>
df1_modelo_Ponderado1<-lm(rendimiento ~ uso_fertilizante
+uso_plaguicida
+uso_credito
+riego
+SUP_TOTAL
25
+gasto_fertilizante
+gasto_plaguicida
+gasto_semilla
+gasto_abono,data = datos_finales_1,
weights = 1/varianza)
summary(df1_modelo_Ponderado1)
##
## Call:
## lm(formula = rendimiento ~ uso_fertilizante + uso_plaguicida +
## uso_credito + riego + SUP_TOTAL + gasto_fertilizante + gasto_plaguicida +
## gasto_semilla + gasto_abono, data = datos_finales_1, weights = 1/varianza)
##
## Weighted Residuals:
## Min 1Q Median 3Q Max
## -5.5109 -1.5471 -0.5010 0.7383 11.2582
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 7.03107514 0.42204853 16.659 < 0.0000000000000002 ***
## uso_fertilizante -0.10132780 0.72884502 -0.139 0.8895
## uso_plaguicida 2.97283191 0.72849848 4.081 0.00004844 ***
## uso_credito 3.93951385 0.84028061 4.688 0.00000313 ***
## riego 1.24482582 0.60151888 2.069 0.0388 *
## SUP_TOTAL 0.00098192 0.00069580 1.411 0.1585
## gasto_fertilizante -0.00005989 0.00007108 -0.843 0.3997
## gasto_plaguicida 0.00007214 0.00003856 1.871 0.0617 .
## gasto_semilla 0.00102256 0.00042177 2.424 0.0155 *
## gasto_abono -0.00004127 0.00004643 -0.889 0.3743
## ---
## Signif. codes: 0 ’***’ 0.001 ’**’ 0.01 ’*’ 0.05 ’.’ 0.1 ’ ’ 1
##
## Residual standard error: 2.423 on 1006 degrees of freedom
## Multiple R-squared: 0.08829, Adjusted R-squared: 0.08013
## F-statistic: 10.82 on 9 and 1006 DF, p-value: 0.0000000000000003526
INTERPRETACIÓN:
Obtenemos la corrección del Modelo 1, si bien es cierto, los signos de las variables independientes no han
cambiado. Pero, se ve una reducción en la mayoría de estimados y de errores estándar.
Asumiendo que el modelo esta correctamente especificado (se cumplen todos los supuestos) podemos inferir
que:
• En el presente modelo de regresión se visualiza que si las variables independientes son 0, entonces el
rendimiento por hectarea aumenta en 703% gracias al intercepto.
• Un cambio en la variable “uso_fertilizante” tiene un efecto negativo del 10.1% sobre el rendimiento por
hectarea.
• Un cambio en los años de “uso_plaguicida” en una unidad tiene un efecto positivo del 297% sobre el
rendimiento por hectarea.
• Un cambio en los años de “uso_credito” en una unidad tiene un efecto positivo del 394% sobre el
rendimiento por hectarea.
26
• Un cambio en los años de “riego” en una unidad tiene un efecto positivo del 124% sobre el rentimiento
por hectarea.
• Un cambio en la variable “SUP_TOTAL” en una unidad tiene un efecto positivo del 0.1% sobre el
rendimiento por hectarea.
• Un cambio en los años de “gasto_fertilizante” en una unidad tiene un efecto negativo del 0.006% sobre el
rendimiento por hectarea.
• Un cambio en los años de “gasto_plaguicida” en una unidad tiene un efecto positivo del 0.007% sobre el
rendimiento por hectarea.
• Un cambio en el número de “gasto_semilla” en una unidad tiene un efecto positivo del 0.1% sobre el
rendimiento por hectarea.
• Un cambio en el número de “gasto_abono” en una unidad tiene un efecto negativo del 0.04% sobre el
rendimiento por hectarea.
b. Modelo 2
##
## Call:
## lm(formula = log(residuales2^2) ~ log(uso_fertilizante + uso_plaguicida +
## uso_credito + riego + SUP_TOTAL + gasto_fertilizante + gasto_plaguicida +
## gasto_semilla + gasto_abono), data = svy_datos_finales$variables)
##
## Residuals:
## Min 1Q Median 3Q Max
## -12.2678 -1.2424 0.4375 1.4530 5.3410
##
## Coefficients:
##
## (Intercept)
## log(uso_fertilizante + uso_plaguicida + uso_credito + riego + SUP_TOTAL + gasto_fertilizante + gasto_
##
## (Intercept)
## log(uso_fertilizante + uso_plaguicida + uso_credito + riego + SUP_TOTAL + gasto_fertilizante + gasto_
##
## (Intercept)
## log(uso_fertilizante + uso_plaguicida + uso_credito + riego + SUP_TOTAL + gasto_fertilizante + gasto_
##
## (Intercept)
## log(uso_fertilizante + uso_plaguicida + uso_credito + riego + SUP_TOTAL + gasto_fertilizante + gasto_
##
## (Intercept)
27
## log(uso_fertilizante + uso_plaguicida + uso_credito + riego + SUP_TOTAL + gasto_fertilizante + gasto_
## ---
## Signif. codes: 0 ’***’ 0.001 ’**’ 0.01 ’*’ 0.05 ’.’ 0.1 ’ ’ 1
##
## Residual standard error: 2.371 on 1014 degrees of freedom
## Multiple R-squared: 0.006772, Adjusted R-squared: 0.005792
## F-statistic: 6.913 on 1 and 1014 DF, p-value: 0.008685
## # A tibble: 6 x 18
## # Groups: ANIO, CCDD, CCPP, CCDI, CONGLOMERADO, NSELUA [6]
## ANIO CCDD CCPP CCDI CONGLOMERADO NSELUA rendimiento uso_fertilizante
## <dbl> <chr> <chr> <chr> <chr> <chr> <dbl> <dbl>
## 1 2019 19 01 02 10672 00018 5.28 1
## 2 2019 19 01 02 10672 00024 3.2 1
## 3 2019 19 01 02 10672 00029 6.19 1
## 4 2019 19 01 02 10672 00040 9.77 1
## 5 2019 19 01 02 10672 00053 3.02 1
## 6 2019 19 01 02 10672 00054 7 1
## # ... with 10 more variables: uso_plaguicida <dbl>, uso_credito <dbl>,
## # riego <dbl>, SUP_TOTAL <dbl>, gasto_fertilizante <dbl>,
## # gasto_plaguicida <dbl>, gasto_semilla <dbl>, gasto_abono <dbl>,
## # FACTOR <dbl>, varianza <dbl>
##
## Call:
## lm(formula = rendimiento ~ uso_fertilizante + uso_plaguicida +
## uso_credito + riego + SUP_TOTAL + gasto_fertilizante + gasto_plaguicida +
## gasto_semilla + gasto_abono, data = datos_finales_2, weights = 1/varianza)
##
## Weighted Residuals:
## Min 1Q Median 3Q Max
## -4.9574 -1.5741 -0.4753 0.8323 11.7175
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 6.68068233 0.39523626 16.903 < 0.0000000000000002 ***
## uso_fertilizante 0.12145624 0.72692318 0.167 0.8673
## uso_plaguicida 2.90885063 0.72659416 4.003 0.00006703 ***
28
## uso_credito 3.77754006 0.84195345 4.487 0.00000807 ***
## riego 1.47069888 0.59740941 2.462 0.0140 *
## SUP_TOTAL 0.00119468 0.00076012 1.572 0.1163
## gasto_fertilizante -0.00005774 0.00008698 -0.664 0.5070
## gasto_plaguicida 0.00008117 0.00004607 1.762 0.0784 .
## gasto_semilla 0.00115136 0.00046332 2.485 0.0131 *
## gasto_abono -0.00003467 0.00005731 -0.605 0.5454
## ---
## Signif. codes: 0 ’***’ 0.001 ’**’ 0.01 ’*’ 0.05 ’.’ 0.1 ’ ’ 1
##
## Residual standard error: 2.502 on 1006 degrees of freedom
## Multiple R-squared: 0.09299, Adjusted R-squared: 0.08488
## F-statistic: 11.46 on 9 and 1006 DF, p-value: < 0.00000000000000022
INTERPRETACIÓN:
Obtenemos la corrección del Modelo 2, si bien es cierto, los signos de las variables independientes no han
cambiado. Pero, se ve una reducción en la mayoría de estimados y de errores estándar.
Asumiendo que el modelo esta correctamente especificado (se cumplen todos los supuestos) podemos inferir
que:
• En el presente modelo de regresión se visualiza que si las variables independientes son 0, entonces el
rendimiento por hectarea aumenta en 668% gracias al intercepto.
• Un cambio en la variable “uso_fertilizante” tiene un efecto positivo del 12% sobre el rendimiento por
hectarea.
• Un cambio en los años de “uso_plaguicida” en una unidad tiene un efecto positivo del 291% sobre el
rendimiento por hectarea.
• Un cambio en los años de “uso_credito” en una unidad tiene un efecto positivo del 377% sobre el
rendimiento por hectarea.
• Un cambio en los años de “riego” en una unidad tiene un efecto positivo del 147% sobre el rentimiento
por hectarea.
• Un cambio en la variable “SUP_TOTAL” en una unidad tiene un efecto positivo del 0.12% sobre el
rendimiento por hectarea.
• Un cambio en los años de “gasto_fertilizante” en una unidad tiene un efecto negativo del 0.006% sobre el
rendimiento por hectarea.
• Un cambio en los años de “gasto_plaguicida” en una unidad tiene un efecto positivo del 0.008% sobre el
rendimiento por hectarea.
• Un cambio en el número de “gasto_semilla” en una unidad tiene un efecto positivo del 0.12% sobre el
rendimiento por hectarea.
• Un cambio en el número de “gasto_abono” en una unidad tiene un efecto negativo del 0.03% sobre el
rendimiento por hectarea.
——————————————————————————
2.3. Normalidad de los residuos a. Modelo 1
qqnorm(df2_modelo_Ponderado2$residuals)
qqline(df2_modelo_Ponderado2$residuals)
29
Normal Q−Q Plot
30
Sample Quantiles
20
10
0
−20
−3 −2 −1 0 1 2 3
Theoretical Quantiles
Prueba de normalidad
shapiro.test(residuales)
##
## Shapiro-Wilk normality test
##
## data: residuales
## W = 0.85571, p-value < 0.00000000000000022
which.max(df1_modelo_Ponderado1$residuals)
## 166
## 166
30
shapiro.test(df1_modelo_Ponderado1$residuals[-166])
##
## Shapiro-Wilk normality test
##
## data: df1_modelo_Ponderado1$residuals[-166]
## W = 0.85891, p-value < 0.00000000000000022
INTERPRETACIÓN: Se confirma que los residuos sí se distribuyen de forma normal a excepción de un dato
extremo. Es necesario estudiar en detalle la influencia de esta observación para determinar si el modelo es
más preciso sin ella.
b. Modelo 2
qqnorm(df2_modelo_Ponderado2$residuals)
qqline(df2_modelo_Ponderado2$residuals)
20
10
0
−20
−3 −2 −1 0 1 2 3
Theoretical Quantiles
Prueba de normalidad
shapiro.test(residuales2)
##
## Shapiro-Wilk normality test
##
## data: residuales2
## W = 0.84222, p-value < 0.00000000000000022
31
INTERPRETACIÓN: En el modelo 2 se obtiene un p-value menor de 0.05 (0.00000000000000022), no pode-
mos aceptar la hipótesis nula (hipótesis de normalidad). Por lo tanto, podemos suponer que existen algunos
datos atípicos.
Identificación del dato atípico
which.max(df2_modelo_Ponderado2$residuals)
## 166
## 166
shapiro.test(df2_modelo_Ponderado2$residuals[-166])
##
## Shapiro-Wilk normality test
##
## data: df2_modelo_Ponderado2$residuals[-166]
## W = 0.85918, p-value < 0.00000000000000022
INTERPRETACIÓN: Se confirma que los residuos sí se distribuyen de forma normal a excepción de un dato
extremo. Es necesario estudiar en detalle la influencia de esta observación para determinar si el modelo es
más preciso sin ella.
——————————————————————————
2.4. Variables influyentes a. Modelo 1
outlierTest(df1_modelo_Ponderado1)
INTERPRETACIÓN: Tal como se apreció en el estudio de normalidad de los residuos, las observaciones 166,
100, 891 y 970 tienen un residuo estandarizado mayor que la desviación estándar de otros residuos.
summary(influence.measures(df1_modelo_Ponderado1))
32
## 102 0.13 -0.04 -0.03 -0.02 -0.03 -0.01 0.00 0.00
## 108 0.12 -0.03 -0.03 -0.02 -0.03 -0.01 0.00 0.00
## 154 0.00 0.00 0.00 0.00 -0.01 0.00 0.00 0.00
## 160 -0.03 0.00 0.02 -0.04 0.10 0.00 0.02 -0.02
## 162 -0.03 0.02 0.03 -0.03 0.12 0.00 0.00 -0.01
## 166 -0.06 0.04 0.07 -0.05 0.25 0.01 -0.01 -0.01
## 219 -0.03 0.02 0.04 -0.03 0.13 0.00 0.00 -0.01
## 237 -0.02 -0.01 -0.01 0.04 0.01 0.00 0.01 -0.01
## 239 0.01 0.03 0.04 -0.06 -0.10 -0.01 0.01 -0.02
## 243 0.01 0.04 0.04 -0.03 -0.05 0.00 -0.01 -0.01
## 259 0.01 0.04 0.04 -0.05 -0.09 -0.01 0.01 -0.02
## 262 -0.03 0.05 0.02 0.28 -0.07 -0.01 -0.01 0.00
## 265 -0.03 0.02 0.03 -0.03 0.11 0.00 0.00 -0.01
## 340 0.00 0.00 0.01 0.01 0.00 -0.25 -0.01 0.02
## 371 0.01 0.05 0.05 -0.04 -0.07 0.00 -0.01 -0.01
## 388 0.05 -0.03 0.01 0.01 -0.01 -0.81 -0.03 0.07
## 418 0.03 0.05 0.05 0.08 0.00 0.00 -0.01 0.02
## 430 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00
## 466 0.08 -0.05 -0.03 -0.02 0.14 -0.01 0.00 0.00
## 707 0.11 -0.03 -0.03 -0.02 -0.03 0.04 0.00 -0.01
## 709 0.05 0.08 -0.09 -0.01 -0.03 0.02 0.27 -0.15
## 711 0.03 0.02 0.07 0.06 0.01 0.00 0.06 -0.12
## 726 0.01 0.00 0.00 -0.03 -0.01 0.00 -0.01 0.00
## 729 0.03 0.03 0.04 -0.06 0.00 0.00 -0.04 0.03
## 737 0.07 0.20 -0.19 -0.01 -0.05 0.00 -0.04 0.04
## 744 0.00 0.00 0.00 0.01 0.01 0.00 -0.01 0.01
## 747 0.14 -0.04 -0.04 -0.02 -0.03 -0.01 0.00 0.00
## 750 0.01 0.06 0.06 -0.04 -0.07 0.02 -0.01 -0.01
## 752 0.06 -0.17 0.17 -0.04 -0.04 0.01 0.02 -0.04
## 754 0.20 -0.06 -0.05 -0.03 -0.05 -0.02 0.00 -0.01
## 756 0.01 -0.04 0.03 0.00 0.01 0.00 0.10 -0.18
## 759 0.18 -0.05 -0.05 -0.03 -0.04 0.07 0.01 -0.01
## 761 -0.01 -0.01 0.01 0.01 0.01 0.03 0.24 -0.41
## 769 0.02 -0.04 0.03 -0.01 -0.02 0.00 -0.10 0.17
## 770 0.01 0.05 0.05 -0.05 -0.09 0.02 -0.02 -0.01
## 771 0.11 -0.30 0.29 -0.06 -0.06 0.02 0.05 -0.08
## 772 -0.04 0.10 -0.04 0.19 -0.03 0.07 -0.18 0.29
## 773 0.04 -0.06 0.06 -0.02 -0.02 0.01 -0.27 0.46
## 774 0.06 -0.15 0.14 -0.03 -0.03 0.01 -0.04 0.06
## 775 0.08 -0.21 0.22 -0.04 -0.04 0.03 -0.03 0.05
## 776 0.03 -0.16 0.14 0.22 -0.04 -0.01 -0.05 0.09
## 777 0.07 -0.14 0.14 -0.03 -0.04 -0.01 -0.20 0.34
## 778 0.08 -0.24 0.24 -0.05 -0.05 0.10 0.04 -0.06
## 780 0.17 -0.05 -0.04 -0.02 -0.04 -0.02 0.00 -0.01
## 783 0.08 -0.21 0.22 -0.04 -0.04 -0.01 0.03 -0.05
## 785 0.09 -0.23 0.24 -0.04 -0.04 -0.02 0.04 -0.06
## 790 0.11 -0.27 0.27 -0.05 -0.05 -0.02 0.04 -0.07
## 798 0.00 0.03 -0.02 -0.06 0.01 -0.01 0.07 -0.11
## 802 -0.01 0.07 -0.04 -0.01 -0.02 -0.01 -0.11 0.31
## 803 0.00 -0.01 -0.01 -0.02 -0.02 0.00 0.00 -0.01
## 834 0.19 -0.05 -0.05 -0.03 -0.05 -0.01 0.00 -0.01
## 852 0.07 -0.18 0.18 -0.03 -0.03 -0.01 0.03 -0.04
## 891 0.12 -0.01 -0.07 -0.06 -0.04 0.09 1.98_* -1.14_*
## 898 0.13 -0.04 -0.07 0.33 -0.04 -0.02 0.00 0.00
33
## 901 0.18 -0.05 -0.05 -0.03 -0.04 -0.02 0.00 -0.01
## 918 0.12 -0.04 -0.07 0.32 -0.04 0.00 0.00 0.00
## 919 0.04 0.50 -0.15 0.06 -0.14 0.10 -6.48_* -0.68
## 923 0.17 -0.05 -0.04 -0.02 -0.04 -0.02 0.00 0.00
## 924 0.00 0.01 0.01 0.03 0.05 0.00 -0.01 0.02
## 926 0.01 0.01 0.01 -0.05 -0.08 0.00 0.01 -0.02
## 933 0.00 0.00 0.00 0.01 0.01 0.00 0.00 0.00
## 940 0.11 -0.34 0.28 0.00 -0.19 -0.07 0.97 -1.71_*
## 942 0.31 -0.04 -0.06 -0.04 0.02 0.03 0.18 -0.11
## 951 0.20 -0.06 -0.05 -0.03 -0.05 0.00 0.00 -0.01
## 953 0.12 -0.03 -0.03 -0.02 -0.03 0.02 0.00 -0.01
## 968 0.13 -0.04 -0.07 0.34 -0.04 0.02 0.00 0.00
## 969 0.07 0.23 -0.22 -0.01 -0.06 0.05 -0.03 0.03
## 970 0.10 0.31 -0.30 -0.02 -0.08 0.05 -0.06 0.05
## 1011 -0.03 0.06 0.02 0.27 -0.06 0.01 -0.02 0.02
## 1012 0.09 0.28 -0.27 -0.02 -0.07 0.05 -0.02 0.03
## 1013 0.06 -0.03 0.03 -0.02 -0.03 -0.03 -0.64 1.08_*
## dfb.gst_s dfb.gst_b dffit cov.r cook.d hat
## 5 -0.28 0.00 -0.30_* 1.03 0.01 0.04_*
## 69 0.00 0.04 -1.18_* 1.93_* 0.14 0.48_*
## 78 0.03 0.00 0.03 1.04_* 0.00 0.03
## 99 0.00 -0.01 0.15 0.93_* 0.00 0.00
## 100 0.00 -0.01 0.23 0.84_* 0.00 0.00
## 101 0.00 -0.01 0.18 0.90_* 0.00 0.00
## 102 0.00 0.00 0.13 0.95_* 0.00 0.00
## 108 0.00 -0.01 0.12 0.96_* 0.00 0.00
## 154 0.02 0.00 0.02 1.03_* 0.00 0.02
## 160 0.07 0.00 0.17 0.97_* 0.00 0.01
## 162 -0.02 0.00 0.16 0.96_* 0.00 0.00
## 166 -0.11 0.00 0.34_* 0.82_* 0.01 0.01
## 219 -0.04 0.00 0.17 0.96_* 0.00 0.00
## 237 0.10 0.00 0.12 1.05_* 0.00 0.04_*
## 239 0.13 0.01 0.23 0.88_* 0.01 0.00
## 243 -0.05 0.00 0.14 0.96_* 0.00 0.00
## 259 0.07 0.01 0.20 0.89_* 0.00 0.00
## 262 -0.06 -0.03 0.32_* 0.93_* 0.01 0.01
## 265 -0.01 0.00 0.15 0.96_* 0.00 0.00
## 340 0.00 0.01 -0.25 1.15_* 0.01 0.12_*
## 371 -0.06 0.00 0.18 0.92_* 0.00 0.00
## 388 0.00 0.03 -0.81_* 1.49_* 0.07 0.33_*
## 418 -0.56 -0.01 -0.57_* 1.11_* 0.03 0.11_*
## 430 0.00 0.00 0.00 1.05_* 0.00 0.03_*
## 466 -0.01 -0.01 0.18 0.97_* 0.00 0.01
## 707 0.00 0.07 0.15 0.95_* 0.00 0.00
## 709 -0.02 -0.01 0.31_* 1.01 0.01 0.03_*
## 711 -0.45 -0.01 -0.47_* 1.22_* 0.02 0.18_*
## 726 -0.04 0.00 -0.06 1.03_* 0.00 0.02
## 729 -0.36 0.01 -0.38_* 1.12_* 0.01 0.11_*
## 737 -0.02 -0.01 0.24 0.95_* 0.01 0.01
## 744 -0.05 0.00 -0.05 1.03_* 0.00 0.03
## 747 0.00 -0.01 0.14 0.94_* 0.00 0.00
## 750 -0.07 0.00 0.20 0.89_* 0.00 0.00
## 752 0.03 0.00 0.21 0.97_* 0.00 0.01
## 754 0.00 -0.01 0.20 0.89_* 0.00 0.00
34
## 756 -0.01 0.00 -0.18 1.15_* 0.00 0.12_*
## 759 0.00 -0.02 0.20 0.89_* 0.00 0.00
## 761 0.01 -0.01 -0.42_* 1.22_* 0.02 0.18_*
## 769 0.03 0.00 0.19 1.04_* 0.00 0.04_*
## 770 0.02 0.00 0.20 0.88_* 0.00 0.00
## 771 0.02 -0.01 0.36_* 0.87_* 0.01 0.01
## 772 -0.06 -0.01 0.37_* 1.00 0.01 0.03_*
## 773 -0.04 0.00 0.49_* 1.02 0.02 0.05_*
## 774 0.01 0.00 0.21 0.97_* 0.00 0.01
## 775 -0.04 0.00 0.28 0.92_* 0.01 0.01
## 776 -0.01 -0.02 0.33_* 0.96_* 0.01 0.02
## 777 -0.02 0.00 0.43_* 0.95_* 0.02 0.02
## 778 0.00 -0.01 0.31_* 0.92_* 0.01 0.01
## 780 0.01 -0.01 0.17 0.91_* 0.00 0.00
## 783 -0.02 0.00 0.26 0.94_* 0.01 0.01
## 785 -0.02 0.00 0.28 0.93_* 0.01 0.01
## 790 -0.03 0.00 0.33_* 0.90_* 0.01 0.01
## 798 -0.02 0.01 -0.15 1.04_* 0.00 0.04_*
## 802 -0.03 0.00 0.33_* 1.04_* 0.01 0.05_*
## 803 0.10 0.00 0.10 1.08_* 0.00 0.06_*
## 834 0.01 -0.01 0.19 0.89_* 0.00 0.00
## 852 -0.01 0.00 0.22 0.96_* 0.00 0.01
## 891 -0.08 0.19 2.04_* 1.00 0.41 0.17_*
## 898 -0.04 -0.04 0.37_* 0.92_* 0.01 0.01
## 901 0.02 -0.01 0.18 0.91_* 0.00 0.00
## 918 -0.04 -0.04 0.37_* 0.92_* 0.01 0.01
## 919 0.62 0.16 -8.57_* 5.54_* 7.25_* 0.84_*
## 923 0.00 0.00 0.17 0.91_* 0.00 0.00
## 924 -0.18 0.00 -0.19 1.03_* 0.00 0.03_*
## 926 0.18 0.01 0.22 0.97_* 0.00 0.01
## 933 -0.03 0.00 -0.04 1.04_* 0.00 0.03_*
## 940 0.17 -0.02 -1.74_* 1.32_* 0.30 0.29_*
## 942 0.06 -7.10_* -7.14_* 22.44_* 5.08_* 0.96_*
## 951 0.03 -0.01 0.20 0.87_* 0.00 0.00
## 953 0.02 -0.01 0.13 0.96_* 0.00 0.00
## 968 -0.03 -0.05 0.39_* 0.90_* 0.02 0.01
## 969 -0.03 0.00 0.28 0.93_* 0.01 0.01
## 970 -0.03 -0.01 0.38_* 0.86_* 0.01 0.01
## 1011 -0.08 -0.01 0.31_* 0.94_* 0.01 0.01
## 1012 -0.04 -0.01 0.34_* 0.88_* 0.01 0.01
## 1013 -0.08 0.01 1.12_* 1.02 0.12 0.11_*
influencePlot(df1_modelo_Ponderado1)
35
166 891
4
Studentized Residuals
2
0
942
−2
919
−4
Hat−Values
b. Modelo 2
outlierTest(df2_modelo_Ponderado2)
INTERPRETACIÓN: Tal como se apreció en el estudio de normalidad de los residuos, las observaciones 166,
100, 754, 970 tienen un residuo estandarizado mayor que las desviaciones estándares de los residuos.
summary(influence.measures(df2_modelo_Ponderado2))
36
## dfb.1_ dfb.us_f dfb.us_p dfb.us_c dfb.rieg dfb.SUP_ dfb.gst_f dfb.gst_p
## 5 0.02 0.02 0.02 0.04 -0.03 0.00 -0.02 0.02
## 69 0.10 -0.05 0.01 0.02 -0.03 -1.24_* -0.04 0.10
## 78 0.00 0.00 0.00 0.00 -0.01 0.00 0.00 0.00
## 99 0.16 -0.04 -0.03 -0.02 -0.04 -0.01 0.00 0.00
## 100 0.22 -0.06 -0.05 -0.03 -0.05 -0.02 0.00 -0.01
## 101 0.18 -0.05 -0.04 -0.03 -0.04 -0.02 0.00 0.00
## 102 0.13 -0.03 -0.03 -0.02 -0.03 -0.01 0.00 0.00
## 108 0.12 -0.03 -0.03 -0.02 -0.03 -0.01 0.00 0.00
## 154 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00
## 162 -0.03 0.02 0.03 -0.03 0.11 0.00 0.00 -0.01
## 166 -0.06 0.04 0.07 -0.05 0.25 0.01 -0.01 -0.01
## 219 -0.03 0.02 0.03 -0.03 0.12 0.00 0.00 -0.01
## 237 -0.01 -0.01 -0.01 0.03 0.01 0.00 0.01 -0.01
## 239 0.01 0.03 0.03 -0.05 -0.09 -0.01 0.01 -0.01
## 243 0.01 0.04 0.05 -0.03 -0.06 0.00 -0.01 -0.01
## 259 0.01 0.03 0.04 -0.05 -0.08 0.00 0.01 -0.02
## 262 -0.03 0.06 0.03 0.28 -0.06 -0.01 -0.01 0.00
## 265 -0.03 0.01 0.03 -0.03 0.10 0.00 0.00 0.00
## 340 0.00 -0.01 0.01 0.01 0.00 -0.26 -0.01 0.02
## 371 0.02 0.05 0.06 -0.04 -0.07 -0.01 -0.01 -0.01
## 388 0.06 -0.03 0.01 0.01 -0.02 -0.84 -0.03 0.07
## 418 0.03 0.05 0.05 0.07 0.00 0.00 -0.01 0.02
## 430 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00
## 466 0.08 -0.05 -0.03 -0.02 0.16 -0.01 0.00 0.00
## 707 0.09 -0.02 -0.02 -0.02 -0.02 0.04 0.00 -0.01
## 709 0.03 0.05 -0.06 -0.01 -0.02 0.02 0.26 -0.14
## 711 0.02 0.02 0.07 0.05 0.01 0.00 0.06 -0.12
## 726 0.01 0.00 0.00 -0.03 -0.01 0.00 -0.01 0.00
## 729 0.03 0.03 0.04 -0.05 0.00 0.00 -0.03 0.03
## 737 0.07 0.22 -0.21 -0.01 -0.05 0.00 -0.04 0.04
## 744 0.00 0.00 0.00 0.01 0.01 0.00 -0.01 0.01
## 747 0.17 -0.04 -0.04 -0.03 -0.04 -0.01 0.00 -0.01
## 750 0.02 0.06 0.06 -0.04 -0.07 0.02 -0.01 -0.01
## 752 0.06 -0.17 0.16 -0.04 -0.04 0.01 0.02 -0.03
## 754 0.24 -0.06 -0.05 -0.04 -0.06 -0.02 0.00 -0.01
## 756 0.00 -0.03 0.03 0.00 0.01 0.00 0.10 -0.17
## 759 0.18 -0.05 -0.04 -0.03 -0.04 0.08 0.01 -0.01
## 761 -0.01 -0.01 0.01 0.01 0.01 0.02 0.21 -0.36
## 769 0.01 -0.03 0.02 -0.01 -0.01 0.00 -0.08 0.15
## 770 0.01 0.05 0.05 -0.05 -0.09 0.02 -0.02 -0.01
## 771 0.11 -0.30 0.30 -0.06 -0.06 0.03 0.04 -0.07
## 772 -0.03 0.08 -0.03 0.14 -0.02 0.05 -0.15 0.26
## 773 0.03 -0.04 0.04 -0.01 -0.01 0.01 -0.22 0.39
## 775 0.07 -0.17 0.18 -0.03 -0.03 0.03 -0.04 0.07
## 776 0.02 -0.13 0.12 0.18 -0.03 -0.01 -0.05 0.09
## 777 0.05 -0.10 0.10 -0.03 -0.03 0.00 -0.18 0.32
## 778 0.07 -0.23 0.24 -0.05 -0.04 0.10 0.03 -0.05
## 780 0.18 -0.05 -0.04 -0.03 -0.05 -0.02 0.00 -0.01
## 782 0.11 -0.03 -0.02 -0.02 -0.03 0.00 0.00 0.00
## 783 0.09 -0.23 0.24 -0.04 -0.04 -0.01 0.03 -0.05
## 785 0.10 -0.25 0.26 -0.05 -0.05 -0.02 0.03 -0.06
## 790 0.11 -0.29 0.31 -0.06 -0.06 -0.02 0.04 -0.07
## 798 0.00 0.02 -0.01 -0.05 0.01 -0.01 0.06 -0.10
37
## 802 0.00 0.05 -0.03 -0.01 -0.01 -0.01 -0.07 0.25
## 803 0.00 0.00 -0.01 -0.01 -0.02 0.00 0.00 0.00
## 834 0.19 -0.05 -0.04 -0.03 -0.05 0.00 0.00 -0.01
## 852 0.07 -0.19 0.20 -0.04 -0.04 -0.01 0.03 -0.04
## 891 0.08 -0.04 -0.03 -0.05 -0.03 0.07 1.74_* -0.97
## 898 0.14 -0.04 -0.08 0.42 -0.05 -0.02 0.00 0.00
## 901 0.19 -0.05 -0.04 -0.03 -0.05 -0.02 0.00 -0.01
## 918 0.13 -0.03 -0.07 0.38 -0.04 0.00 0.00 0.00
## 919 0.00 0.40 -0.09 0.06 -0.11 0.08 -5.06_* -0.59
## 923 0.16 -0.04 -0.03 -0.03 -0.04 -0.01 0.00 0.00
## 924 0.00 0.01 0.01 0.03 0.04 0.00 -0.01 0.02
## 933 0.00 0.00 0.00 0.01 0.01 0.00 0.00 0.00
## 940 0.08 -0.26 0.22 0.00 -0.14 -0.05 0.77 -1.42_*
## 942 0.25 -0.03 -0.04 -0.03 0.02 0.03 0.16 -0.09
## 951 0.20 -0.06 -0.05 -0.03 -0.05 0.01 0.00 -0.01
## 953 0.12 -0.03 -0.03 -0.02 -0.03 0.03 0.00 -0.01
## 968 0.12 -0.03 -0.07 0.38 -0.04 0.03 0.00 0.00
## 969 0.06 0.22 -0.21 -0.01 -0.05 0.06 -0.02 0.03
## 970 0.09 0.32 -0.30 -0.02 -0.08 0.06 -0.05 0.05
## 1011 -0.03 0.05 0.02 0.23 -0.05 0.01 -0.02 0.03
## 1012 0.08 0.27 -0.25 -0.02 -0.06 0.05 0.00 0.02
## 1013 0.03 0.00 0.01 -0.02 -0.02 -0.02 -0.50 0.89
## dfb.gst_s dfb.gst_b dffit cov.r cook.d hat
## 5 -0.27 0.00 -0.28 1.03 0.01 0.04_*
## 69 0.01 0.04 -1.24_* 1.89_* 0.15 0.47_*
## 78 0.02 0.00 0.02 1.04_* 0.00 0.03
## 99 0.00 -0.01 0.16 0.92_* 0.00 0.00
## 100 0.00 0.00 0.22 0.83_* 0.00 0.00
## 101 0.00 0.00 0.18 0.89_* 0.00 0.00
## 102 0.00 0.00 0.13 0.94_* 0.00 0.00
## 108 0.00 0.00 0.12 0.96_* 0.00 0.00
## 154 0.01 0.00 0.01 1.03_* 0.00 0.02
## 162 -0.01 0.00 0.15 0.96_* 0.00 0.00
## 166 -0.11 0.00 0.35_* 0.81_* 0.01 0.01
## 219 -0.04 0.00 0.17 0.96_* 0.00 0.00
## 237 0.08 0.00 0.09 1.05_* 0.00 0.04_*
## 239 0.13 0.00 0.21 0.90_* 0.00 0.00
## 243 -0.05 0.00 0.15 0.95_* 0.00 0.00
## 259 0.07 0.00 0.18 0.90_* 0.00 0.00
## 262 -0.06 -0.02 0.32_* 0.93_* 0.01 0.01
## 265 -0.01 0.00 0.14 0.97_* 0.00 0.00
## 340 0.00 0.01 -0.26 1.15_* 0.01 0.13_*
## 371 -0.06 0.00 0.19 0.91_* 0.00 0.00
## 388 0.00 0.03 -0.84_* 1.49_* 0.07 0.33_*
## 418 -0.52 -0.01 -0.53_* 1.10_* 0.03 0.11_*
## 430 0.00 0.00 0.00 1.05_* 0.00 0.04_*
## 466 -0.01 -0.01 0.20 0.96_* 0.00 0.01
## 707 0.00 0.08 0.13 0.96_* 0.00 0.00
## 709 -0.02 -0.01 0.29 1.02 0.01 0.03_*
## 711 -0.41 -0.01 -0.44_* 1.19_* 0.02 0.16_*
## 726 -0.04 0.00 -0.06 1.03_* 0.00 0.02
## 729 -0.34 0.01 -0.36_* 1.12_* 0.01 0.10_*
## 737 -0.03 -0.01 0.26 0.95_* 0.01 0.01
## 744 -0.05 0.00 -0.05 1.03_* 0.00 0.02
38
## 747 0.00 -0.01 0.17 0.92_* 0.00 0.00
## 750 -0.07 0.00 0.20 0.89_* 0.00 0.00
## 752 0.03 0.00 0.20 0.97_* 0.00 0.01
## 754 0.00 -0.02 0.24 0.85_* 0.01 0.00
## 756 0.00 0.00 -0.17 1.15_* 0.00 0.12_*
## 759 0.00 -0.02 0.21 0.88_* 0.00 0.00
## 761 0.01 -0.01 -0.37_* 1.21_* 0.01 0.17_*
## 769 0.02 0.00 0.16 1.04_* 0.00 0.04_*
## 770 0.03 0.00 0.20 0.88_* 0.00 0.00
## 771 0.03 -0.01 0.36_* 0.87_* 0.01 0.01
## 772 -0.05 0.00 0.31_* 1.01 0.01 0.03
## 773 -0.03 0.00 0.42_* 1.03_* 0.02 0.05_*
## 775 -0.04 0.00 0.24 0.93_* 0.01 0.01
## 776 -0.01 -0.02 0.27 0.97_* 0.01 0.01
## 777 -0.02 0.00 0.37_* 0.97_* 0.01 0.02
## 778 0.01 -0.01 0.30 0.92_* 0.01 0.01
## 780 0.02 -0.01 0.19 0.90_* 0.00 0.00
## 782 0.00 -0.01 0.11 0.97_* 0.00 0.00
## 783 -0.02 0.00 0.28 0.93_* 0.01 0.01
## 785 -0.02 0.00 0.31_* 0.92_* 0.01 0.01
## 790 -0.03 -0.01 0.36_* 0.89_* 0.01 0.01
## 798 -0.02 0.00 -0.12 1.04_* 0.00 0.03_*
## 802 -0.03 0.00 0.27 1.05_* 0.01 0.05_*
## 803 0.08 0.00 0.08 1.08_* 0.00 0.07_*
## 834 0.01 -0.01 0.19 0.88_* 0.00 0.00
## 852 -0.01 0.00 0.23 0.96_* 0.01 0.01
## 891 -0.08 0.16 1.77_* 1.07_* 0.31 0.18_*
## 898 -0.05 -0.04 0.46_* 0.89_* 0.02 0.02
## 901 0.02 -0.01 0.19 0.89_* 0.00 0.00
## 918 -0.04 -0.04 0.43_* 0.90_* 0.02 0.01
## 919 0.55 0.14 -6.57_* 5.05_* 4.28_* 0.82_*
## 923 0.00 0.00 0.16 0.91_* 0.00 0.00
## 924 -0.17 0.00 -0.17 1.03_* 0.00 0.03_*
## 933 -0.04 0.00 -0.04 1.04_* 0.00 0.03_*
## 940 0.13 -0.02 -1.44_* 1.32_* 0.21 0.28_*
## 942 0.06 -5.89_* -5.91_* 18.20_* 3.49_* 0.95_*
## 951 0.03 -0.01 0.20 0.86_* 0.00 0.00
## 953 0.02 -0.01 0.13 0.95_* 0.00 0.00
## 968 -0.04 -0.04 0.43_* 0.89_* 0.02 0.01
## 969 -0.03 0.00 0.26 0.93_* 0.01 0.01
## 970 -0.03 -0.01 0.38_* 0.86_* 0.01 0.01
## 1011 -0.07 0.00 0.27 0.94_* 0.01 0.01
## 1012 -0.04 -0.01 0.32_* 0.89_* 0.01 0.01
## 1013 -0.07 0.01 0.92_* 1.05_* 0.08 0.11_*
influencePlot(df2_modelo_Ponderado2)
39
166
100
4
Studentized Residuals
2
0
942
−2
919
Hat−Values
——————————————————————————
cbind(mf1$coefficients[,1],
mf2$coefficients[,1])
## [,1] [,2]
## (Intercept) 7.03107514055 6.68068233223
## uso_fertilizante -0.10132779694 0.12145623886
## uso_plaguicida 2.97283191462 2.90885063142
## uso_credito 3.93951385060 3.77754005670
## riego 1.24482582002 1.47069887585
40
## SUP_TOTAL 0.00098192450 0.00119467804
## gasto_fertilizante -0.00005988727 -0.00005773672
## gasto_plaguicida 0.00007213651 0.00008116838
## gasto_semilla 0.00102256489 0.00115136267
## gasto_abono -0.00004127370 -0.00003466711
ols_plot_diagnostics(df1_modelo_Ponderado1)
page 1 of 3
Residual vs Predicted Values Outlier and Leverage Diagnostics for rendimient
40 8
Observation
4
RStudent
Residual
20 normal
0 leverage
0 outlier
−4
outlier & leverage
−20
5 10 15 20 0.00 0.25 0.50 0.75 1.00
Predicted Value Leverage
Deleted Studentized Residual
3 Observation 20
normal
0
outlier 0
−3
−20
5 10 15 20 −2 0 2
Predicted Value Theoretical Quantiles
41
page 2 of 3
Observed by Predicted for rendimiento Residual Fit Spread Plot
15
20
rendimiento
Fit − Mean
10
15
5
10 0
5 −5
6
Cook's D
Residual
25
4
0
2
0 −25
0 250 500 750 1000 0.0 0.4 0.8 1.2
Observation Proportion Less
42
page 3 of 3
Residual Histogram
600
400
y
200
0
−20 0 20 40
Residuals
20
−20
ols_plot_diagnostics(df2_modelo_Ponderado2)
43
page 1 of 3
Residual vs Predicted Values Outlier and Leverage Diagnostics for rendimient
40 8
Observation
4
RStudent
Residual
20 normal
leverage
0
0 outlier
−4 outlier & leverage
−20
5 10 15 20 25 0.00 0.25 0.50 0.75
Predicted Value Leverage
Deleted Studentized Residual
Sample Quantiles
4
Observation 20
2
normal
0
outlier 0
−2
−4 −20
5 10 15 20 25 −2 0 2
Predicted Value Theoretical Quantiles
44
page 2 of 3
Observed by Predicted for rendimiento Residual Fit Spread Plot
25
20
rendimiento
Fit − Mean
10
15
10 0
Residual
3 25
2
0
1
0 −25
0 250 500 750 1000 0.0 0.4 0.8 1.2
Observation Proportion Less
45
page 3 of 3
Residual Histogram
600
400
y
200
0
−20 0 20 40
Residuals
20
−20
#——————————————————————————#
IMPORTANTE: Según los modelos planteados para “df1_modelo_Ponderado1” y “df2_modelo_Ponderado2”
obtenemos que los R cuadrados son de 0.08829 (es decir que explica el modelo en 8.8%) y 0.09299 (es
decir que explica el modelo en 9.3%) respectivamente, siendo el modelo mejor explicado el el segundo. Sin
embargo también hacemos un a prueba de AIC para corroborar nuestra elección.
3.2. Prueba AIC del Modelo 1 y 2
AIC(df1_modelo_Ponderado1)
## [1] 7149.354
#-----------
AIC(df2_modelo_Ponderado2)
## [1] 7130.459
INTERPRETACIÓN: El AIC para el modelo1 es de 7149.354, por otro lado el AIC para el modelo2 es de
7130.459. Por ende el modelo que mas se ajusta es el que tiene menor AIC el cual es el modelo2.
——————————————————————————
a. Modelo 2
46
Table 1: Chow test
summary(df2_modelo_Ponderado2)
##
## Call:
## lm(formula = rendimiento ~ uso_fertilizante + uso_plaguicida +
## uso_credito + riego + SUP_TOTAL + gasto_fertilizante + gasto_plaguicida +
## gasto_semilla + gasto_abono, data = datos_finales_2, weights = 1/varianza)
##
## Weighted Residuals:
## Min 1Q Median 3Q Max
## -4.9574 -1.5741 -0.4753 0.8323 11.7175
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 6.68068233 0.39523626 16.903 < 0.0000000000000002 ***
## uso_fertilizante 0.12145624 0.72692318 0.167 0.8673
## uso_plaguicida 2.90885063 0.72659416 4.003 0.00006703 ***
## uso_credito 3.77754006 0.84195345 4.487 0.00000807 ***
## riego 1.47069888 0.59740941 2.462 0.0140 *
## SUP_TOTAL 0.00119468 0.00076012 1.572 0.1163
## gasto_fertilizante -0.00005774 0.00008698 -0.664 0.5070
## gasto_plaguicida 0.00008117 0.00004607 1.762 0.0784 .
## gasto_semilla 0.00115136 0.00046332 2.485 0.0131 *
## gasto_abono -0.00003467 0.00005731 -0.605 0.5454
## ---
## Signif. codes: 0 ’***’ 0.001 ’**’ 0.01 ’*’ 0.05 ’.’ 0.1 ’ ’ 1
##
## Residual standard error: 2.502 on 1006 degrees of freedom
## Multiple R-squared: 0.09299, Adjusted R-squared: 0.08488
## F-statistic: 11.46 on 9 and 1006 DF, p-value: < 0.00000000000000022
INTERPRETACIÓN: Tenemos que los únicos parámetros significativos son los que presentan un p valor
menor al 5%, los cuales son uso_plaguicida (0.00006703), el uso_credito (0.00000807), riego (0.0140) y
gasto_semilla (0.0131).
——————————————————————————
INTERPRETACIÓN: Debido a que no hay ningún valor de Chow mayor que F, no habría ningún cambio
estructural en el modelo.
47