Final Ep4

Download as pdf or txt
Download as pdf or txt
You are on page 1of 47

INTEGRANTES GRUPO 7: - ACUÑA GONZALES ANGEL - BUSTAMANTE CARRANZA LUCY -

ROMERO SALAS HARRY - ACENCIO VARGAS NICOLE - SILVA PEREZ BRYANT

library(haven)
library(survey)

## Warning: package ’survey’ was built under R version 4.1.3

## Loading required package: grid

## Loading required package: Matrix

## Loading required package: survival

##
## Attaching package: ’survey’

## The following object is masked from ’package:graphics’:


##
## dotchart

library(tidyverse)

## -- Attaching packages --------------------------------------- tidyverse 1.3.1 --

## v ggplot2 3.3.5 v purrr 0.3.4


## v tibble 3.1.6 v dplyr 1.0.8
## v tidyr 1.2.0 v stringr 1.4.0
## v readr 2.1.2 v forcats 0.5.1

## -- Conflicts ------------------------------------------ tidyverse_conflicts() --


## x tidyr::expand() masks Matrix::expand()
## x dplyr::filter() masks stats::filter()
## x dplyr::lag() masks stats::lag()
## x tidyr::pack() masks Matrix::pack()
## x tidyr::unpack() masks Matrix::unpack()

library(readxl)
library(knitr)
library(kableExtra)

## Warning: package ’kableExtra’ was built under R version 4.1.3

##
## Attaching package: ’kableExtra’

## The following object is masked from ’package:dplyr’:


##
## group_rows

1
#------------------
library(mctest)
library(lmtest)

## Warning: package ’lmtest’ was built under R version 4.1.3

## Loading required package: zoo

## Warning: package ’zoo’ was built under R version 4.1.3

##
## Attaching package: ’zoo’

## The following objects are masked from ’package:base’:


##
## as.Date, as.Date.numeric

library(foreign)
library(ggplot2)
library(strucchange)

## Warning: package ’strucchange’ was built under R version 4.1.3

## Loading required package: sandwich

## Warning: package ’sandwich’ was built under R version 4.1.3

##
## Attaching package: ’strucchange’

## The following object is masked from ’package:stringr’:


##
## boundary

library (dplyr)
library(car)

## Warning: package ’car’ was built under R version 4.1.3

## Loading required package: carData

## Warning: package ’carData’ was built under R version 4.1.3

##
## Attaching package: ’car’

## The following object is masked from ’package:dplyr’:


##
## recode

## The following object is masked from ’package:purrr’:


##
## some

2
library(olsrr)

## Warning: package ’olsrr’ was built under R version 4.1.3

##
## Attaching package: ’olsrr’

## The following object is masked from ’package:datasets’:


##
## rivers

#-------------------------------------*
options(scipen=999)
#-------------------------------------*
#dir.ubigeo <- "E:\\OneDrive - Universidad de San Martin de Porres\\Datos\\UBIGEO_2019.xlsx" #file.choos
maindir <- "C:/Users/Bryant Omar/Desktop/FINAL EP4"
#-------------------------------------*
#RUTAS DE TRABAJO
#-------------------------------------*
subdir.caract_UA1 <- c("/701-Modulo1529/01_Cap100_1.sav")
subdir.caract_UA2 <- c("/701-Modulo1529/01_Cap100_2.sav")
subdir.caract_financieras <- c("/701-Modulo1545/17_Cap900.sav")
#----*
subdir.sup_cosech <- c("/701-Modulo1530/02_Cap200ab.sav")
subdir.costo_cosech <- c("/701-Modulo1536/08_Cap200e.sav")
subdir.prod_cosech <- c("/701-Modulo1533/05_Cap200b.sav")
subdir.costo_produccion <- c("/701-Modulo1546/18_Cap1000.sav")
subdir.sup_cultivada <- c("/701-Modulo1549/21_Cap1200a.sav")
subdir.uso_tierra <- c("/701-Modulo1550/22_Cap1200a_1.sav")

#CARGANDO TABLA DE DATOS


#datos_ubigeo <- read_excel(dir.ubigeo)
CAR_UA1 <- read_sav(paste0(maindir,subdir.caract_UA1)) %>% filter(CCDD=="19")
CAR_UA2 <- read_sav(paste0(maindir,subdir.caract_UA2))%>% filter(CCDD=="19")
caract_financieras <- read_sav(paste0(maindir,subdir.caract_financieras)) %>% filter(CCDD=="19")
#--------------*
sup_cosechada <- read_sav(paste0(maindir,subdir.sup_cosech)) %>% filter(CCDD=="19")
costo_cosechada <- read_sav(paste0(maindir,subdir.costo_cosech)) %>% filter(CCDD=="19")
prod_cosechada <- read_sav(paste0(maindir,subdir.prod_cosech)) %>% filter(CCDD=="19")
costo_produccion <- read_sav(paste0(maindir,subdir.costo_produccion)) %>% filter(CCDD=="19")
s.cultivada <- read_sav(paste0(maindir,subdir.sup_cultivada)) %>% filter(CCDD=="19")
uso_tierra <- read_sav(paste0(maindir,subdir.uso_tierra)) %>% filter(CCDD=="19")

Análisis de las dimensiones de las tablas de datos

colnames(CAR_UA1)

## [1] "ANIO" "CCDD" "NOMBREDD" "CCPP" "NOMBREPV"


## [6] "CCDI" "NOMBREDI" "CONGLOMERADO" "NSELUA" "UA"
## [11] "ESTRATO" "RESFIN" "REGION" "DOMINIO" "FACTOR"
## [16] "CODIGO" "P15" "P101A" "P101" "P102_1"

3
## [21] "P102_2" "P102_3" "P102A_MES" "P102A_ANIO" "P102B"
## [26] "P103" "P103_EE" "P103_N" "P104_SUP_1" "P104_SUP_2"
## [31] "P104_UM" "P104_COD" "P104_EQUIV_1" "P104_EQUIV_2" "P104_SUP_ha"
## [36] "P229B" "P229F" "P242_1" "P242_2" "P242_3"
## [41] "P242_4" "P410A" "P418"

colnames(CAR_UA2)

## [1] "ANIO" "CCDD" "NOMBREDD" "CCPP"


## [5] "NOMBREPV" "CCDI" "NOMBREDI" "CONGLOMERADO"
## [9] "NSELUA" "UA" "ESTRATO" "RESFIN"
## [13] "REGION" "DOMINIO" "FACTOR" "CODIGO"
## [17] "P101A" "P102_1" "P102_2" "P102_3"
## [21] "P105_N" "P105_PROV_COD" "P105_PROV_NOM" "P105_DIST_COD"
## [25] "P105_DIST_NOM" "P105_SUP_1" "P105_SUP_2" "P105_EQUIV_1"
## [29] "P105_EQUIV_2" "P105_SUP_ha" "P110_1" "P110_2"
## [33] "P110_3" "P110_4" "P110_5" "P111"
## [37] "P202" "P224A" "P224G_1" "P224G_2"
## [41] "P224G_3" "P224G_4" "P224G_5" "P224G_6"
## [45] "P224G_8" "P224G_7"

#HALLANDO DUPLICADOS
dim(CAR_UA1) #dimensiones de una matriz de datos

## [1] 1180 43

dim(CAR_UA2) #dimensiones de una matriz de datos

## [1] 5568 46

#------------
temp_1 <- dim(CAR_UA1 %>% distinct(ANIO,CCDD,CCPP,CCDI,CONGLOMERADO,NSELUA,UA))
temp_2 <- dim(CAR_UA2 %>% distinct(ANIO,CCDD,CCPP,CCDI,CONGLOMERADO,NSELUA,UA))
#-------------
print(c(temp_1,temp_2))

## [1] 1180 7 1066 7

Podemos ver que el número de unidades agropecuarias (UA) de la tabla de datos CAR_UA1 es 1180, 7 y el
número de undidades agropecuarias (UA) de la tabla CAR_UA2 es 1066, 7. Como CAR_UA2 tiene menos
UA, esto indica que CAR_UA2 podría ser un subconjunto de la tabla CAR_UA1. Además, se observa que
la tabla CAR_UA2 tiene más filas, esto es porque se ecuentra a nivel de parcela.
Para poder identificar cuántas veces se duplica el ID de una unidad agropecuaria (el cual está compuesto por
las variables ANIO,CCDD,CCPP,CCDI,CONGLOMERADO,NSELUA,UA) utilizamos el siguiente
código.

#HALLANDO DUPLICADOS
CAR_UA2 <- CAR_UA2 %>%
group_by(ANIO,CCDD,CCPP,CCDI,CONGLOMERADO,NSELUA,UA) %>%
mutate(dup = n()) #CREA UNA COLUMNA DE NOMBRE 'dup' QUE CUENTA EL NÚMERO DE FILAS CON LOS MIS

4
Esta técnica utilizada para identificar filas duplicadas nos permite comprender que la tabla de datos se
encuentra a nivel de parcelas, en el siguiente caso particular presentamos un productor que tiene 90 parcelas.
Es importante tener en cuenta, que en el Perú distintos agricultores pueden tener distinas maneras de
medir la superficie agrícola. Por ello, es necesario estandarizar estas cantidades a una medida convencional
como hectáreas. Utilizamos el siguiente código para calcular la equivalencia a hectáreas y posteriormente
multiplicarlo sobre el total de superficie indicado.

CAR_UA1 <- CAR_UA1 %>% mutate(EQUIV_TOTAL=as.numeric(paste0(P104_EQUIV_1,".",P104_EQUIV_2)),


SUP_TOTAL=as.numeric(paste0(P104_SUP_1,".",P104_SUP_2))*EQUIV_TOTAL)

## Warning in mask$eval_all_mutate(quo): NAs introducidos por coerción

## Warning in mask$eval_all_mutate(quo): NAs introducidos por coerción

Se puede comparar la variable creada ‘SUP_TOTAL’ con la variable indicada por el INEI ‘P104_SUP_ha’.

sum(CAR_UA1$SUP_TOTAL,na.rm = T)

## [1] 53714.1

sum(CAR_UA1$P104_SUP_ha,na.rm = T)

## [1] 53714.1

Esta misma metodología se utilizará para el cálculo de superficie SEMBRADA y superficie


COSECHADA

#CREAMOS LA SIGUIENTE TABLA PARA AGREGAR LA COLUMNA 'EQUIV_TOTAL' EN LAS TABLAS NECESARIAS COMO LA DE SU
CAR_EQUIV <- CAR_UA1 %>% select(ANIO,CCDD,CCPP,CCDI,CONGLOMERADO,NSELUA,UA,EQUIV_TOTAL)
#-----------------*
sup_cosechada <- sup_cosechada %>% left_join(CAR_EQUIV,
by=c("ANIO","CCDD","CCPP","CCDI","CONGLOMERADO","NSELUA","U
#-----------------*
sup_cosechada <- sup_cosechada %>% mutate(sup_sembrada_raw=as.numeric(paste0(P210_SUP_1,".",P210_SUP_2))
sup_sembrada_ha=as.numeric(paste0(P210_SUP_1,".",P210_SUP_2))*
sup_cosechada_ha=as.numeric(paste0(P217_SUP_1,".",P217_SUP_2))

## Warning in mask$eval_all_mutate(quo): NAs introducidos por coerción

## Warning in mask$eval_all_mutate(quo): NAs introducidos por coerción

#-------------------------------------------------*
s.cultivada <- s.cultivada %>% left_join(CAR_EQUIV, by=c("ANIO","CCDD","CCPP","CCDI","CONGLOMERADO","NSE
s.cultivada <- s.cultivada %>% mutate(SUP_CULTIVADA=as.numeric(paste0(P1206_SUP_1,".",P1206_SUP_2))*EQUI
#-------------------------------------------------*
uso_tierra <- uso_tierra %>% left_join(CAR_EQUIV, by=c("ANIO","CCDD","CCPP","CCDI","CONGLOMERADO","NSELU

Ahora realizaremos algunas estadísticas descriptivas de las covariables a analizar (antes de costruir el conjunto
de datos para nuestro modelo)
Analisis de la superficie cosechada y destino de los cultivos cosechados

5
#----------------------------------------*
sup_cosechada <- sup_cosechada %>% mutate(cosechara_raw = as.numeric(paste0(P219_CANT_1,".",P219_C
destino_1_venta = as.numeric(paste0(P220_1_CANT_1,".",P220
destino_2_consumo = as.numeric(paste0(P220_2_ENT,".",P220_2_
destino_3_semilla = as.numeric(paste0(P220_3_ENT,".",P220_3_
destino_3_semilla_autoinsumo = as.numeric(paste0(P220_3A_ENT,"
destino_3_semilla_venta = as.numeric(paste0(P220_3B_ENT,"
destino_4_trueque = as.numeric(paste0(P220_4_ENT,".",P220_4_
destino_5_animales = as.numeric(paste0(P220_5_ENT,".",P220_5_
destino_6_derivados = as.numeric(paste0(P220_6_ENT,".",P220_6_
destino_7_otro = as.numeric(paste0(P220_7_ENT,".",P220_7_
destino_8_otro = as.numeric(paste0(P220_8_ENT,".",P220_8_
destino_9_otro = as.numeric(paste0(P220_9_ENT,".",P220_9_
destino_10_otro = as.numeric(paste0(P220_10_ENT,".",P220_1

## Warning in mask$eval_all_mutate(quo): NAs introducidos por coerción

## Warning in mask$eval_all_mutate(quo): NAs introducidos por coerción

## Warning in mask$eval_all_mutate(quo): NAs introducidos por coerción

## Warning in mask$eval_all_mutate(quo): NAs introducidos por coerción

## Warning in mask$eval_all_mutate(quo): NAs introducidos por coerción

## Warning in mask$eval_all_mutate(quo): NAs introducidos por coerción

#----------------------------------------*
#View(sup_cosechada %>% select(cosechara_raw,destino_3_semilla,starts_with("P220_3A"),starts_with("P220_
#----------------------------------------*
#View(sup_cosechada %>% select(cosechara_raw,starts_with("destino")))
#----------------------------------------*
sup_cosechada <- sup_cosechada %>% mutate(cosechara = as.numeric(paste0(P219_CANT_1,".",P219_CANT_2))*P2
destino_1_venta_kg=destino_1_venta*P219_EQUIV_KG*P220_1_PRE_KG
cosecho = as.numeric(paste0(P224_CANT_1,".",P224_CANT_2))*P224

## Warning in mask$eval_all_mutate(quo): NAs introducidos por coerción

#----------------*
#View(sup_cosechada %>% filter(P220_1_VAL!=destino_1_venta_kg)%>% select(destino_1_venta,destino_1_venta
#----------------------------------------*
#head(sup_cosechada %>% filter(is.na(P224_CANT_1)==F) %>% select(starts_with("P224")),10)
#------------*

Construyendo tabla de datos a nivel de unidad agropecuaria

sup_cosechada <- sup_cosechada %>% mutate(riego=ifelse(P212>1,1,0)) #RIEGO: 1 = EL CULTIVO TIENE RIEGO


#------------------------*
#
#
#------------------------*
destino_names <- colnames(sup_cosechada %>% select(starts_with("destino")))

6
#--------------------*
ua_produccion <- sup_cosechada %>%
group_by(ANIO,CCDD,CCPP,CCDI,CONGLOMERADO,NSELUA,UA) %>%
summarise_at(.vars = c("sup_sembrada_ha","sup_cosechada_ha","cosechara","cosecho","riego",destino_na
.funs = sum,
na.rm=T)
#--------------------*
ua_produccion <- ua_produccion %>% mutate(riego=ifelse(riego>0,1,0))
#--------------------*
ua_produccion <- ua_produccion %>% inner_join(CAR_UA1, by=c("ANIO","CCDD","CCPP","CCDI","CONGLOMERADO","
#--------------------*
ua_produccion <- ua_produccion %>%
mutate(across(.cols =
c(sup_sembrada_ha, sup_cosechada_ha,SUP_TOTAL), #VECTOR DE VARIABLES A MODIFICAR
.fns = ~case_when(.x > 0 & .x < 1 ~ "1. Menos de 1 ha",
.x >= 1 & .x < 2 ~ "2. Entre 1 y menos de 2 ha",
.x >= 2 & .x < 5 ~ "3. Entre 2 y menos de 5 ha",
.x >= 5 & .x < 10 ~ "4. Entre 5 y menos de 10 ha",
.x >= 10 & is.na(.x)==F ~ "5. Mas de 10 ha",
TRUE ~ as.character(NA)),
.names = "{.col}_cat"))
#--------------------*
ua_produccion <- ua_produccion %>% mutate(cosechara_t=cosechara/1000,
cosecho_t=cosecho/1000,
rendimiento=cosechara_t/sup_cosechada_ha)

Análisis con datos muestrales, calculamos el rendimiento

ua_produccion %>% ungroup() %>%


summarise_at(.vars = c("sup_cosechada_ha","cosechara_t"),
.funs = sum,
na.rm = T)

## # A tibble: 1 x 2
## sup_cosechada_ha cosechara_t
## <dbl> <dbl>
## 1 21221. 257262.

#----------------------------------------*

Gráficos de la variable dependiente de nuestro modelo: Rendimiento por hectarea

par(mfrow=c(2,2))
hist(ua_produccion$rendimiento,main = "Histograma rendimiento")
hist(log(ua_produccion$rendimiento),main = "Histograma del logaritmo del rendimiento")
boxplot(ua_produccion$rendimiento,outline = T)
boxplot(ua_produccion$rendimiento,outline = F)

7
Histograma rendimiento Histograma del logaritmo del rendimiento
Frequency

Frequency

150
150
0

0
0 10 20 30 40 50 −2 −1 0 1 2 3 4

ua_produccion$rendimiento log(ua_produccion$rendimiento)

10 20
20 40
0

Analisis de datos muestrales: Rendimiento por hectarea según tamaño de la UA

ua_produccion %>% group_by(SUP_TOTAL_cat) %>%


summarise(sup_cosechada_ha=sum(sup_cosechada_ha,na.rm = T),
cosechara_t = sum(cosechara_t,na.rm = T),
rendimiento = cosechara_t/sup_cosechada_ha)

## # A tibble: 5 x 4
## SUP_TOTAL_cat sup_cosechada_ha cosechara_t rendimiento
## <chr> <dbl> <dbl> <dbl>
## 1 1. Menos de 1 ha 54.0 476. 8.82
## 2 2. Entre 1 y menos de 2 ha 77.3 816. 10.6
## 3 3. Entre 2 y menos de 5 ha 192. 1295. 6.75
## 4 4. Entre 5 y menos de 10 ha 229. 1412. 6.16
## 5 5. Mas de 10 ha 20668. 253262. 12.3

plot(ua_produccion$SUP_TOTAL,ua_produccion$rendimiento)

8
50
ua_produccion$rendimiento

40
30
20
10
0

0 2000 4000 6000 8000

ua_produccion$SUP_TOTAL

plot(log(ua_produccion$SUP_TOTAL),log(ua_produccion$rendimiento))

9
4
log(ua_produccion$rendimiento)

3
2
1
0
−1

−4 −2 0 2 4 6 8

log(ua_produccion$SUP_TOTAL)

cor.test(ua_produccion$SUP_TOTAL,ua_produccion$rendimiento)

##
## Pearson’s product-moment correlation
##
## data: ua_produccion$SUP_TOTAL and ua_produccion$rendimiento
## t = 0.9361, df = 1014, p-value = 0.3494
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
## -0.03217676 0.09072304
## sample estimates:
## cor
## 0.02938419

INTERPRETACIÓN Se observa que el coeficiente de correlacion de la superficie total y el rendimiento por


hectarea es de 0.02938419, cabe resaltar que cuando se encuentra cercano al 0 la correlacion de las variables
es debil ya que es menor a 0.5.
Análisis de la variable dependiente con los datos expandidos:

svy_ua_produccion <- svydesign(ids = ~1, weights = ~FACTOR, data = ua_produccion)


#----------------------------------------*
svyby(formula = ~cosechara_t,
denominator = ~sup_cosechada_ha,
by=~SUP_TOTAL_cat,

10
design = svy_ua_produccion,
FUN = svyratio)

## SUP_TOTAL_cat
## 1. Menos de 1 ha 1. Menos de 1 ha
## 2. Entre 1 y menos de 2 ha 2. Entre 1 y menos de 2 ha
## 3. Entre 2 y menos de 5 ha 3. Entre 2 y menos de 5 ha
## 4. Entre 5 y menos de 10 ha 4. Entre 5 y menos de 10 ha
## 5. Mas de 10 ha 5. Mas de 10 ha
## cosechara_t/sup_cosechada_ha
## 1. Menos de 1 ha 8.293887
## 2. Entre 1 y menos de 2 ha 9.542421
## 3. Entre 2 y menos de 5 ha 5.504476
## 4. Entre 5 y menos de 10 ha 5.735255
## 5. Mas de 10 ha 14.012611
## se.cosechara_t/sup_cosechada_ha
## 1. Menos de 1 ha 0.5961282
## 2. Entre 1 y menos de 2 ha 0.9385284
## 3. Entre 2 y menos de 5 ha 0.5086327
## 4. Entre 5 y menos de 10 ha 1.2490285
## 5. Mas de 10 ha 2.2607454

svyby(formula = ~cosechara_t,
denominator = ~sup_cosechada_ha,
by=~riego,
design = svy_ua_produccion,
FUN = svyratio)

## riego cosechara_t/sup_cosechada_ha se.cosechara_t/sup_cosechada_ha


## 0 0 13.584265 2.188562
## 1 1 8.155822 1.044784

INTERPRETACIÓN: Se observa que los que no riegan obtienen un rendimiento de 14 aproximadamente.


Mientras los que riegan obtendrán un rendimiento de 8 aproximadamente.
——————————————————————————

costo_cosechada <- costo_cosechada %>% mutate(uso_fertilizante=ifelse(P238==1,1,0),


uso_plaguicida=ifelse(P240==1,1,0))
#-----------------------------------------------*
ua_cosech <- costo_cosechada %>%
group_by(ANIO,CCDD,CCPP,CCDI,CONGLOMERADO,NSELUA,UA) %>%
summarise(uso_fertilizante=max(uso_fertilizante,na.rm = T),
uso_plaguicida=max(uso_plaguicida,na.rm = T),
gasto_fertilizante=sum(P239,na.rm = T),
gasto_plaguicida=sum(P241,na.rm = T),
gasto_abono=sum(P237_VAL,na.rm = T),
gasto_semilla=sum(P235_VAL,na.rm = T))

## ‘summarise()‘ has grouped output by ’ANIO’, ’CCDD’, ’CCPP’, ’CCDI’,


## ’CONGLOMERADO’, ’NSELUA’. You can override using the ‘.groups‘ argument.

11
#-----------------------------------------------*
ua_produccion <- ua_produccion %>% left_join(ua_cosech,by=c("ANIO","CCDD","CCPP","CCDI","CONGLOMERADO","

svy_ua_produccion <- svydesign(ids = ~1, weights = ~FACTOR, data = ua_produccion)

#----------------------------------------*
svyby(formula = ~cosechara_t,
denominator = ~sup_cosechada_ha,
by=~uso_fertilizante,
design = svy_ua_produccion,
FUN = svyratio)

## uso_fertilizante cosechara_t/sup_cosechada_ha se.cosechara_t/sup_cosechada_ha


## 0 0 13.02612 2.655755
## 1 1 13.41790 1.467254

INTERPRETACIÓN: Se observa que los que no usan fertilizante obtienen un rendimiento de 13.03 aproxi-
madamente. Mientras los que usan fertilizante obtendrán un rendimiento de 13.42 aproximadamente.

svyby(formula = ~cosechara_t,
denominator = ~sup_cosechada_ha,
by=~uso_plaguicida,
design = svy_ua_produccion,
FUN = svyratio)

## uso_plaguicida cosechara_t/sup_cosechada_ha se.cosechara_t/sup_cosechada_ha


## 0 0 12.33826 2.957562
## 1 1 14.78439 1.226085

INTERPRETACIÓN: Se observa que los que no usan plaguicida obtienen un rendimiento de 12.34 aproxi-
madamente. Mientras los que usan plaguicida obtendrán un rendimiento de 14.78 aproximadamente.
——————————————————————————

caract_financieras <- caract_financieras %>% mutate(uso_credito=ifelse(P902==1,1,0)) %>% mutate(uso_cred


#CREDITO: 1 = EL AGRICULTOR TIENE ACCESO A CRÉDITO

#-------------------------------------------------
#Verificación de NA: table(caract_financieras$uso_credito,useNA="ifany")
#-------------------------------------------------
ua_credito <- caract_financieras %>%
group_by(ANIO,CCDD,CCPP,CCDI,CONGLOMERADO,NSELUA,UA) %>%
summarise(uso_credito=max(uso_credito, na.rm = T))

## ‘summarise()‘ has grouped output by ’ANIO’, ’CCDD’, ’CCPP’, ’CCDI’,


## ’CONGLOMERADO’, ’NSELUA’. You can override using the ‘.groups‘ argument.

#-----------------------------------------------------------------
ua_produccion <- ua_produccion %>% left_join(ua_credito,by=c("ANIO","CCDD","CCPP","CCDI","CONGLOMERADO",

12
svy_ua_produccion <- svydesign(ids = ~1, weights = ~FACTOR, data = ua_produccion)

#----------------------------------------*
svyby(formula = ~cosechara_t,
denominator = ~sup_cosechada_ha,
by=~uso_credito,
design = svy_ua_produccion,
FUN = svyratio)

## uso_credito cosechara_t/sup_cosechada_ha se.cosechara_t/sup_cosechada_ha


## 0 0 12.72156 2.276129
## 1 1 16.26895 2.481226

INTERPRETACIÓN: Se observa que los que no usan credito obtienen un rendimiento de 12.72 aproximada-
mente. Mientras los que usan credito obtendrán un rendimiento de 16.27 aproximadamente.
——————————————————————————

ua_produccion_final <- ua_produccion %>% select(ANIO,NOMBREDD,NOMBREPV,NOMBREDI,CCDD,CCPP,CCDI,CONGLOMER


rendimiento,starts_with("sup"),starts_with("gasto"),rieg
uso_fertilizante,uso_plaguicida,uso_credito)

costo_produccion <- costo_produccion %>%


mutate(gasto_jornal=rowSums(costo_produccion %>% select(P1001A_2A_1,P1001A_2A_2,P1001A_2B_1,P1001A_2
cantidad_jornaleros=rowSums(costo_produccion %>% select(P1001A_2A_1C,P1001A_2A_2C,P1001A_2B_1
gasto_maquinaria=rowSums(costo_produccion %>% select(P1001A_5A,P1001A_5B,P1001A_6A,P1001A_6B,
gasto_riego=P1001A_3,
gasto_asistencia_tecnica=P1001A_4)

ua_produccion_final <- ua_produccion_final %>% left_join(costo_produccion,by=c("ANIO","CCDD","CCPP","CCD


#-------------------------------------------------------------------------------

1. ANÁLISIS DESCRIPTIVO

VARIABLE DEPENDIENTE: Es aquella varirable que depende de variables independientes para aumentar
o reducir en cantidad. En el caso presente, nuestra variable dependiente es el Rendimiento.
VARIABLES INDEPENDIENTES: Son aquellas variables que no dependen de un factor externo, sino que
mas bien determinan el valor de una dependiente.
a.Modelo 1

datos_finales_1 <- ua_produccion_final %>% filter(rendimiento>0)


datos_finales_1 <- datos_finales_1 %>% select(rendimiento, uso_fertilizante ,uso_plaguicida, uso_credi

## Adding missing grouping variables: ‘ANIO‘, ‘CCDD‘, ‘CCPP‘, ‘CCDI‘,


## ‘CONGLOMERADO‘, ‘NSELUA‘

datos_finales_1 <- datos_finales_1[complete.cases(datos_finales_1),]

13
modelo1 <- lm(rendimiento~ uso_fertilizante
+uso_plaguicida
+uso_credito
+riego
+SUP_TOTAL
+gasto_fertilizante
+gasto_plaguicida
+gasto_semilla
+gasto_abono ,
data = datos_finales_1)
summary(modelo1)

##
## Call:
## lm(formula = rendimiento ~ uso_fertilizante + uso_plaguicida +
## uso_credito + riego + SUP_TOTAL + gasto_fertilizante + gasto_plaguicida +
## gasto_semilla + gasto_abono, data = datos_finales_1)
##
## Residuals:
## Min 1Q Median 3Q Max
## -19.333 -5.243 -1.713 2.428 37.714
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 7.14089855 0.43085031 16.574 < 0.0000000000000002 ***
## uso_fertilizante -0.17832292 0.73002653 -0.244 0.8071
## uso_plaguicida 3.00292658 0.72998451 4.114 0.00004212 ***
## uso_credito 3.97580189 0.83939672 4.736 0.00000249 ***
## riego 1.17569382 0.60321631 1.949 0.0516 .
## SUP_TOTAL 0.00092345 0.00067803 1.362 0.1735
## gasto_fertilizante -0.00006033 0.00006681 -0.903 0.3668
## gasto_plaguicida 0.00006929 0.00003653 1.897 0.0582 .
## gasto_semilla 0.00098522 0.00041004 2.403 0.0165 *
## gasto_abono -0.00004298 0.00004353 -0.987 0.3237
## ---
## Signif. codes: 0 ’***’ 0.001 ’**’ 0.01 ’*’ 0.05 ’.’ 0.1 ’ ’ 1
##
## Residual standard error: 8.156 on 1006 degrees of freedom
## Multiple R-squared: 0.08695, Adjusted R-squared: 0.07878
## F-statistic: 10.64 on 9 and 1006 DF, p-value: 0.0000000000000007006

INTERPRETACIÓN:
Asumiendo que el modelo esta correctamente especificado (se cumplen todos los supuestos) podemos inferir
que:
• En el presente modelo de regresión se visualiza que si las variables independientes son 0, entonces el
rendimiento por hectarea aumenta en 714% gracias al intercepto.
• Un cambio en la variable “uso_fertilizante” tiene un efecto negativo del 17.8% sobre el rendimiento por
hectarea.
• Un cambio en los años de “uso_plaguicida” en una unidad tiene un efecto positivo del 300%% sobre el
rendimiento por hectarea.

14
• Un cambio en los años de “uso_credito” en una unidad tiene un efecto positivo del 398%% sobre el
rendimiento por hectarea.
• Un cambio en los años de “riego” en una unidad tiene un efecto positivo del 118% sobre el rentimiento
por hectarea.
• Un cambio en la variable “SUP_TOTAL” en una unidad tiene un efecto positivo del 0.09% sobre el
rendimiento por hectarea.
• Un cambio en los años de “gasto_fertilizante” en una unidad tiene un efecto negativo del 0.006% sobre el
rendimiento por hectarea.
• Un cambio en los años de “gasto_plaguicida” en una unidad tiene un efecto positivo del 0.007% sobre el
rendimiento por hectarea.
• Un cambio en el número de “gasto_semilla” en una unidad tiene un efecto positivo del 0.1% sobre el
rendimiento por hectarea.
• Un cambio en el número de “gasto_abono” en una unidad tiene un efecto negativo del 0.004% sobre el
rendimiento por hectarea.

b. Modelo 2

datos_finales_2 <- ua_produccion_final %>% filter(rendimiento>0)


datos_finales_2 <- datos_finales_2 %>% select(rendimiento, uso_fertilizante ,uso_plaguicida,uso_credit

## Adding missing grouping variables: ‘ANIO‘, ‘CCDD‘, ‘CCPP‘, ‘CCDI‘,


## ‘CONGLOMERADO‘, ‘NSELUA‘

datos_finales_2 <- datos_finales_2[complete.cases(datos_finales_2),]


#-------------------------------------------------------------------
svy_datos_finales <- svydesign(ids = ~1, weights = ~FACTOR, data = datos_finales_2)

modelo2 <- svyglm(rendimiento~ uso_fertilizante


+uso_plaguicida
+uso_credito
+riego
+SUP_TOTAL
+gasto_fertilizante
+gasto_plaguicida
+gasto_semilla
+gasto_abono,
design = svy_datos_finales,
family = gaussian(link = "identity"))
summary(modelo2)

##
## Call:
## svyglm(formula = rendimiento ~ uso_fertilizante + uso_plaguicida +
## uso_credito + riego + SUP_TOTAL + gasto_fertilizante + gasto_plaguicida +
## gasto_semilla + gasto_abono, design = svy_datos_finales,
## family = gaussian(link = "identity"))
##
## Survey design:
## svydesign(ids = ~1, weights = ~FACTOR, data = datos_finales_2)

15
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 5.79631429 0.44313178 13.080 < 0.0000000000000002 ***
## uso_fertilizante 0.99869245 0.94530298 1.056 0.2910
## uso_plaguicida 1.84259658 0.93958437 1.961 0.0501 .
## uso_credito 2.43591013 1.03437371 2.355 0.0187 *
## riego 2.51827069 0.53531334 4.704 0.0000029 ***
## SUP_TOTAL 0.00658744 0.00340150 1.937 0.0531 .
## gasto_fertilizante -0.00016759 0.00018260 -0.918 0.3589
## gasto_plaguicida 0.00005455 0.00010955 0.498 0.6187
## gasto_semilla 0.00132185 0.00051217 2.581 0.0100 **
## gasto_abono -0.00002581 0.00008330 -0.310 0.7567
## ---
## Signif. codes: 0 ’***’ 0.001 ’**’ 0.01 ’*’ 0.05 ’.’ 0.1 ’ ’ 1
##
## (Dispersion parameter for gaussian family taken to be 58.36385)
##
## Number of Fisher Scoring iterations: 2

INTERPRETACIÓN:
Asumiendo que el modelo esta correctamente especificado (se cumplen todos los supuestos) podemos inferir
que:
• En el presente modelo de regresión se visualiza que si las variables independientes son 0, entonces el
rendimiento por hectarea aumenta en 580% gracias al intercepto.
• Un cambio en la variable “uso_fertilizante” tiene un efecto positivo del 100% sobre el rendimiento por
hectarea.
• Un cambio en los años de “uso_plaguicida” en una unidad tiene un efecto positivo del 184% sobre el
rendimiento por hectarea.
• Un cambio en los años de “uso_credito” en una unidad tiene un efecto positivo del 244% sobre el
rendimiento por hectarea.
• Un cambio en los años de “riego” en una unidad tiene un efecto positivo del 252% sobre el rentimiento
por hectarea.
• Un cambio en la variable “SUP_TOTAL” en una unidad tiene un efecto positivo del 0.7% sobre el
rendimiento por hectarea.
• Un cambio en los años de “gasto_fertilizante” en una unidad tiene un efecto negativo del 0.02% sobre el
rendimiento por hectarea.
• Un cambio en los años de “gasto_plaguicida” en una unidad tiene un efecto positivo del 0.005% sobre el
rendimiento por hectarea.
• Un cambio en el número de “gasto_semilla” en una unidad tiene un efecto positivo del 0.13% sobre el
rendimiento por hectarea.
• Un cambio en el número de “gasto_abono” en una unidad tiene un efecto negativo del 0.003% sobre el
rendimiento por hectarea.

c. Comparación de gráficos del Modelo 1 y 2

16
plot(log(modelo1$fitted.values),log(svy_datos_finales$variables$rendimiento))
log(svy_datos_finales$variables$rendimiento)

4
3
2
1
0
−1

1.5 2.0 2.5 3.0

log(modelo1$fitted.values)

#-----------------------------------------------------------------
plot(log(modelo2$fitted.values),log(svy_datos_finales$variables$rendimiento))

## Warning in log(modelo2$fitted.values): Se han producido NaNs

17
log(svy_datos_finales$variables$rendimiento)

4
3
2
1
0
−1

1.5 2.0 2.5 3.0 3.5 4.0

log(modelo2$fitted.values)

INTERPRETACIÓN: Observando la grafica del modelo 1 y 2 se puede determinar que presenta heterocedas-
ticidad, debido a que el error no es constante presenta datos atípicos o aberrantes.

2. ANÁLISIS DE SUPUESTOS 2.1. Supuesto de multicolinealidad

a. Modelo 1

imcdiag(modelo1)

##
## Call:
## imcdiag(mod = modelo1)
##
##
## All Individual Multicollinearity Diagnostics Result
##
## VIF TOL Wi Fi Leamer CVIF Klein IND1
## uso_fertilizante 2.0006 0.4999 125.9489 144.0845 0.7070 2.1258 1 0.0040
## uso_plaguicida 2.0034 0.4991 126.3040 144.4907 0.7065 2.1288 1 0.0040
## uso_credito 1.0307 0.9703 3.8590 4.4146 0.9850 1.0952 0 0.0077
## riego 1.0529 0.9498 6.6569 7.6155 0.9746 1.1188 0 0.0075
## SUP_TOTAL 1.0222 0.9783 2.7938 3.1961 0.9891 1.0862 0 0.0078
## gasto_fertilizante 1.5820 0.6321 73.2549 83.8030 0.7951 1.6810 1 0.0050
## gasto_plaguicida 1.6136 0.6197 77.2399 88.3619 0.7872 1.7147 1 0.0049
## gasto_semilla 1.1466 0.8722 18.4501 21.1068 0.9339 1.2184 1 0.0069

18
## gasto_abono 1.0131 0.9871 1.6476 1.8849 0.9935 1.0765 0 0.0078
## IND2
## uso_fertilizante 2.2602
## uso_plaguicida 2.2633
## uso_credito 0.1344
## riego 0.2270
## SUP_TOTAL 0.0981
## gasto_fertilizante 1.6624
## gasto_plaguicida 1.7185
## gasto_semilla 0.5777
## gasto_abono 0.0584
##
## 1 --> COLLINEARITY is detected by the test
## 0 --> COLLINEARITY is not detected by the test
##
## uso_fertilizante , riego , SUP_TOTAL , gasto_fertilizante , gasto_plaguicida , gasto_abono , coeffici
##
## R-square of y on all x: 0.0869
##
## * use method argument to check which regressors may be the reason of collinearity
## ===================================

INTERPRETACIÓN: Vemos que se presenta multicolinealidad en las variables de: “uso_fertilizante,


uso_plaguicida, gasto_fertilizante, gasto_plaguicida, gasto_semila” mientras que las que no presentan son:
“riego, SUP_TOTAL, gasto_abono, uso_credito”. Por lo tanto se puede decir que hay una predominancia
de variables multicolineales.

b. Modelo 2

imcdiag(modelo2)

##
## Call:
## imcdiag(mod = modelo2)
##
##
## All Individual Multicollinearity Diagnostics Result
##
## VIF TOL Wi Fi Leamer CVIF Klein IND1
## uso_fertilizante 2.0006 0.4999 125.9489 144.0845 0.7070 2.1258 1 0.0040
## uso_plaguicida 2.0034 0.4991 126.3040 144.4907 0.7065 2.1288 1 0.0040
## uso_credito 1.0307 0.9703 3.8590 4.4146 0.9850 1.0952 0 0.0077
## riego 1.0529 0.9498 6.6569 7.6155 0.9746 1.1188 0 0.0075
## SUP_TOTAL 1.0222 0.9783 2.7938 3.1961 0.9891 1.0862 0 0.0078
## gasto_fertilizante 1.5820 0.6321 73.2549 83.8030 0.7951 1.6810 1 0.0050
## gasto_plaguicida 1.6136 0.6197 77.2399 88.3619 0.7872 1.7147 1 0.0049
## gasto_semilla 1.1466 0.8722 18.4501 21.1068 0.9339 1.2184 1 0.0069
## gasto_abono 1.0131 0.9871 1.6476 1.8849 0.9935 1.0765 0 0.0078
## IND2
## uso_fertilizante 2.2602
## uso_plaguicida 2.2633
## uso_credito 0.1344
## riego 0.2270

19
## SUP_TOTAL 0.0981
## gasto_fertilizante 1.6624
## gasto_plaguicida 1.7185
## gasto_semilla 0.5777
## gasto_abono 0.0584
##
## 1 --> COLLINEARITY is detected by the test
## 0 --> COLLINEARITY is not detected by the test
##
## uso_fertilizante , riego , SUP_TOTAL , gasto_fertilizante , gasto_plaguicida , gasto_abono , coeffici
##
## R-square of y on all x: 0.0869
##
## * use method argument to check which regressors may be the reason of collinearity
## ===================================

INTERPRETACIÓN: Vemos que se presenta multicolinealidad en las variables de: “uso_fertilizante,


uso_plaguicida, gasto_fertilizante, gasto_plaguicida, gasto_semila” mientras que las que no presentan son:
“riego, SUP_TOTAL, gasto_abono, uso_credito”. Por lo tanto se puede decir que hay una predominancia
de variables multicolineales.
——————————————————————————
2.2. Supuesto de heterocedasticidad 2.2.1. Identificación usando Breusch-Pagan a. Modelo 1

residuales<-modelo1$residuals
prediccion<-modelo1$fitted.values
ggplot(datos_finales_1,aes(uso_fertilizante
+uso_plaguicida
+uso_credito
+riego
+SUP_TOTAL
+gasto_fertilizante
+gasto_plaguicida
+gasto_semilla
+gasto_abono, rendimiento))+geom_point()

20
50

40

30
rendimiento

20

10

0 100000 200000 300000


uso_fertilizante + uso_plaguicida + uso_credito + riego + SUP_TOTAL + ...

modelo_breusch <- lm((residualesˆ2) ~ uso_fertilizante


+uso_plaguicida
+uso_credito
+riego
+SUP_TOTAL
+gasto_fertilizante
+gasto_plaguicida
+gasto_semilla
+gasto_abono,data=datos_finales_1)
summary(modelo_breusch)

##
## Call:
## lm(formula = (residuales^2) ~ uso_fertilizante + uso_plaguicida +
## uso_credito + riego + SUP_TOTAL + gasto_fertilizante + gasto_plaguicida +
## gasto_semilla + gasto_abono, data = datos_finales_1)
##
## Residuals:
## Min 1Q Median 3Q Max
## -402.50 -60.01 -39.37 -13.16 1375.51
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 66.0752081 8.1162825 8.141 0.00000000000000115 ***
## uso_fertilizante -26.4752112 13.7521115 -1.925 0.0545 .

21
## uso_plaguicida 26.2909347 13.7513201 1.912 0.0562 .
## uso_credito 30.7373021 15.8124081 1.944 0.0522 .
## riego -18.8277819 11.3632829 -1.657 0.0979 .
## SUP_TOTAL 0.0101113 0.0127726 0.792 0.4288
## gasto_fertilizante 0.0023624 0.0012586 1.877 0.0608 .
## gasto_plaguicida 0.0009270 0.0006881 1.347 0.1782
## gasto_semilla -0.0050356 0.0077242 -0.652 0.5146
## gasto_abono -0.0002331 0.0008200 -0.284 0.7762
## ---
## Signif. codes: 0 ’***’ 0.001 ’**’ 0.01 ’*’ 0.05 ’.’ 0.1 ’ ’ 1
##
## Residual standard error: 153.6 on 1006 degrees of freedom
## Multiple R-squared: 0.02646, Adjusted R-squared: 0.01775
## F-statistic: 3.038 on 9 and 1006 DF, p-value: 0.001361

bptest(datos_finales_1$rendimiento ~ datos_finales_1$uso_fertilizante
+datos_finales_1$uso_plaguicida
+datos_finales_1$uso_credito
+datos_finales_1$riego
+datos_finales_1$SUP_TOTAL
+datos_finales_1$gasto_fertilizante
+datos_finales_1$gasto_plaguicida
+datos_finales_1$gasto_semilla
+datos_finales_1$gasto_abono)

##
## studentized Breusch-Pagan test
##
## data: datos_finales_1$rendimiento ~ datos_finales_1$uso_fertilizante + datos_finales_1$uso_plagu
## BP = 26.884, df = 9, p-value = 0.001462

INTERPRETACIÓN: A través de las pruebas de Breusch Pagan, se confirma que existe heterocedasticidad
en el modelo 1.

b. Modelo 2

residuales2 <-modelo2$residuals
prediccion2 <-modelo2$fitted.values
ggplot(svy_datos_finales$variables,aes(uso_fertilizante
+uso_plaguicida
+uso_credito
+riego
+SUP_TOTAL
+gasto_fertilizante
+gasto_plaguicida
+gasto_semilla
+gasto_abono, rendimiento))+geom_point()

22
50

40

30
rendimiento

20

10

0 100000 200000 300000


uso_fertilizante + uso_plaguicida + uso_credito + riego + SUP_TOTAL + ...

modelo_breusch<-lm((residuales2ˆ2) ~ uso_fertilizante
+uso_plaguicida
+uso_credito
+riego
+SUP_TOTAL
+gasto_fertilizante
+gasto_plaguicida
+gasto_semilla
+gasto_abono,data = svy_datos_finales$variables)
summary(modelo_breusch)

##
## Call:
## lm(formula = (residuales2^2) ~ uso_fertilizante + uso_plaguicida +
## uso_credito + riego + SUP_TOTAL + gasto_fertilizante + gasto_plaguicida +
## gasto_semilla + gasto_abono, data = svy_datos_finales$variables)
##
## Residuals:
## Min 1Q Median 3Q Max
## -584.13 -58.18 -39.53 -18.71 1372.57
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 53.5845221 8.8717710 6.040 0.00000000217 ***
## uso_fertilizante -17.3495176 15.0322004 -1.154 0.2487

23
## uso_plaguicida 24.0828655 15.0313353 1.602 0.1094
## uso_credito 28.1240756 17.2842757 1.627 0.1040
## riego -14.2759629 12.4210123 -1.149 0.2507
## SUP_TOTAL 0.2957122 0.0139615 21.181 < 0.0000000000000002 ***
## gasto_fertilizante 0.0033814 0.0013758 2.458 0.0141 *
## gasto_plaguicida -0.0003582 0.0007522 -0.476 0.6340
## gasto_semilla -0.0024662 0.0084432 -0.292 0.7703
## gasto_abono -0.0007019 0.0008963 -0.783 0.4337
## ---
## Signif. codes: 0 ’***’ 0.001 ’**’ 0.01 ’*’ 0.05 ’.’ 0.1 ’ ’ 1
##
## Residual standard error: 167.9 on 1006 degrees of freedom
## Multiple R-squared: 0.3207, Adjusted R-squared: 0.3146
## F-statistic: 52.77 on 9 and 1006 DF, p-value: < 0.00000000000000022

bptest(svy_datos_finales$variables$rendimiento ~ svy_datos_finales$variables$uso_fertilizante
+svy_datos_finales$variables$uso_plaguicida
+svy_datos_finales$variables$uso_credito
+svy_datos_finales$variables$riego
+svy_datos_finales$variables$SUP_TOTAL
+svy_datos_finales$variables$gasto_fertilizante
+svy_datos_finales$variables$gasto_plaguicida
+svy_datos_finales$variables$gasto_semilla
+svy_datos_finales$variables$gasto_abono)

##
## studentized Breusch-Pagan test
##
## data: svy_datos_finales$variables$rendimiento ~ svy_datos_finales$variables$uso_fertilizante + s
## BP = 26.884, df = 9, p-value = 0.001462

INTERPRETACIÓN: A través de las pruebas de Breusch Pagan, se confirma que existe heterocedasticidad
en el modelo 2.
——————————————————————————
2.2.2. Corrección de los modelos (No se conocen la varianzas) a. Modelo 1

df1_varianza <- lm(log(residualesˆ2) ~ log(uso_fertilizante


+uso_plaguicida
+uso_credito
+riego
+SUP_TOTAL
+gasto_fertilizante
+gasto_plaguicida
+gasto_semilla
+gasto_abono)
, data = datos_finales_1)
summary(df1_varianza)

##
## Call:
## lm(formula = log(residuales^2) ~ log(uso_fertilizante + uso_plaguicida +

24
## uso_credito + riego + SUP_TOTAL + gasto_fertilizante + gasto_plaguicida +
## gasto_semilla + gasto_abono), data = datos_finales_1)
##
## Residuals:
## Min 1Q Median 3Q Max
## -12.9386 -1.0813 0.5215 1.5182 4.8429
##
## Coefficients:
##
## (Intercept)
## log(uso_fertilizante + uso_plaguicida + uso_credito + riego + SUP_TOTAL + gasto_fertilizante + gasto_
##
## (Intercept)
## log(uso_fertilizante + uso_plaguicida + uso_credito + riego + SUP_TOTAL + gasto_fertilizante + gasto_
##
## (Intercept)
## log(uso_fertilizante + uso_plaguicida + uso_credito + riego + SUP_TOTAL + gasto_fertilizante + gasto_
##
## (Intercept)
## log(uso_fertilizante + uso_plaguicida + uso_credito + riego + SUP_TOTAL + gasto_fertilizante + gasto_
##
## (Intercept)
## log(uso_fertilizante + uso_plaguicida + uso_credito + riego + SUP_TOTAL + gasto_fertilizante + gasto_
## ---
## Signif. codes: 0 ’***’ 0.001 ’**’ 0.01 ’*’ 0.05 ’.’ 0.1 ’ ’ 1
##
## Residual standard error: 2.478 on 1014 degrees of freedom
## Multiple R-squared: 0.0003615, Adjusted R-squared: -0.0006243
## F-statistic: 0.3667 on 1 and 1014 DF, p-value: 0.5449

datos_finales_1$varianza <- exp(df1_varianza$fitted.values)


head(datos_finales_1)

## # A tibble: 6 x 17
## # Groups: ANIO, CCDD, CCPP, CCDI, CONGLOMERADO, NSELUA [6]
## ANIO CCDD CCPP CCDI CONGLOMERADO NSELUA rendimiento uso_fertilizante
## <dbl> <chr> <chr> <chr> <chr> <chr> <dbl> <dbl>
## 1 2019 19 01 02 10672 00018 5.28 1
## 2 2019 19 01 02 10672 00024 3.2 1
## 3 2019 19 01 02 10672 00029 6.19 1
## 4 2019 19 01 02 10672 00040 9.77 1
## 5 2019 19 01 02 10672 00053 3.02 1
## 6 2019 19 01 02 10672 00054 7 1
## # ... with 9 more variables: uso_plaguicida <dbl>, uso_credito <dbl>,
## # riego <dbl>, SUP_TOTAL <dbl>, gasto_fertilizante <dbl>,
## # gasto_plaguicida <dbl>, gasto_semilla <dbl>, gasto_abono <dbl>,
## # varianza <dbl>

df1_modelo_Ponderado1<-lm(rendimiento ~ uso_fertilizante
+uso_plaguicida
+uso_credito
+riego
+SUP_TOTAL

25
+gasto_fertilizante
+gasto_plaguicida
+gasto_semilla
+gasto_abono,data = datos_finales_1,
weights = 1/varianza)
summary(df1_modelo_Ponderado1)

##
## Call:
## lm(formula = rendimiento ~ uso_fertilizante + uso_plaguicida +
## uso_credito + riego + SUP_TOTAL + gasto_fertilizante + gasto_plaguicida +
## gasto_semilla + gasto_abono, data = datos_finales_1, weights = 1/varianza)
##
## Weighted Residuals:
## Min 1Q Median 3Q Max
## -5.5109 -1.5471 -0.5010 0.7383 11.2582
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 7.03107514 0.42204853 16.659 < 0.0000000000000002 ***
## uso_fertilizante -0.10132780 0.72884502 -0.139 0.8895
## uso_plaguicida 2.97283191 0.72849848 4.081 0.00004844 ***
## uso_credito 3.93951385 0.84028061 4.688 0.00000313 ***
## riego 1.24482582 0.60151888 2.069 0.0388 *
## SUP_TOTAL 0.00098192 0.00069580 1.411 0.1585
## gasto_fertilizante -0.00005989 0.00007108 -0.843 0.3997
## gasto_plaguicida 0.00007214 0.00003856 1.871 0.0617 .
## gasto_semilla 0.00102256 0.00042177 2.424 0.0155 *
## gasto_abono -0.00004127 0.00004643 -0.889 0.3743
## ---
## Signif. codes: 0 ’***’ 0.001 ’**’ 0.01 ’*’ 0.05 ’.’ 0.1 ’ ’ 1
##
## Residual standard error: 2.423 on 1006 degrees of freedom
## Multiple R-squared: 0.08829, Adjusted R-squared: 0.08013
## F-statistic: 10.82 on 9 and 1006 DF, p-value: 0.0000000000000003526

INTERPRETACIÓN:
Obtenemos la corrección del Modelo 1, si bien es cierto, los signos de las variables independientes no han
cambiado. Pero, se ve una reducción en la mayoría de estimados y de errores estándar.
Asumiendo que el modelo esta correctamente especificado (se cumplen todos los supuestos) podemos inferir
que:
• En el presente modelo de regresión se visualiza que si las variables independientes son 0, entonces el
rendimiento por hectarea aumenta en 703% gracias al intercepto.
• Un cambio en la variable “uso_fertilizante” tiene un efecto negativo del 10.1% sobre el rendimiento por
hectarea.
• Un cambio en los años de “uso_plaguicida” en una unidad tiene un efecto positivo del 297% sobre el
rendimiento por hectarea.
• Un cambio en los años de “uso_credito” en una unidad tiene un efecto positivo del 394% sobre el
rendimiento por hectarea.

26
• Un cambio en los años de “riego” en una unidad tiene un efecto positivo del 124% sobre el rentimiento
por hectarea.
• Un cambio en la variable “SUP_TOTAL” en una unidad tiene un efecto positivo del 0.1% sobre el
rendimiento por hectarea.
• Un cambio en los años de “gasto_fertilizante” en una unidad tiene un efecto negativo del 0.006% sobre el
rendimiento por hectarea.
• Un cambio en los años de “gasto_plaguicida” en una unidad tiene un efecto positivo del 0.007% sobre el
rendimiento por hectarea.
• Un cambio en el número de “gasto_semilla” en una unidad tiene un efecto positivo del 0.1% sobre el
rendimiento por hectarea.
• Un cambio en el número de “gasto_abono” en una unidad tiene un efecto negativo del 0.04% sobre el
rendimiento por hectarea.

b. Modelo 2

df2_varianza <- lm(log(residuales2ˆ2) ~ log(uso_fertilizante


+uso_plaguicida
+uso_credito
+riego
+SUP_TOTAL
+gasto_fertilizante
+gasto_plaguicida
+gasto_semilla
+gasto_abono), data = svy_datos_finales$variables)
summary(df2_varianza)

##
## Call:
## lm(formula = log(residuales2^2) ~ log(uso_fertilizante + uso_plaguicida +
## uso_credito + riego + SUP_TOTAL + gasto_fertilizante + gasto_plaguicida +
## gasto_semilla + gasto_abono), data = svy_datos_finales$variables)
##
## Residuals:
## Min 1Q Median 3Q Max
## -12.2678 -1.2424 0.4375 1.4530 5.3410
##
## Coefficients:
##
## (Intercept)
## log(uso_fertilizante + uso_plaguicida + uso_credito + riego + SUP_TOTAL + gasto_fertilizante + gasto_
##
## (Intercept)
## log(uso_fertilizante + uso_plaguicida + uso_credito + riego + SUP_TOTAL + gasto_fertilizante + gasto_
##
## (Intercept)
## log(uso_fertilizante + uso_plaguicida + uso_credito + riego + SUP_TOTAL + gasto_fertilizante + gasto_
##
## (Intercept)
## log(uso_fertilizante + uso_plaguicida + uso_credito + riego + SUP_TOTAL + gasto_fertilizante + gasto_
##
## (Intercept)

27
## log(uso_fertilizante + uso_plaguicida + uso_credito + riego + SUP_TOTAL + gasto_fertilizante + gasto_
## ---
## Signif. codes: 0 ’***’ 0.001 ’**’ 0.01 ’*’ 0.05 ’.’ 0.1 ’ ’ 1
##
## Residual standard error: 2.371 on 1014 degrees of freedom
## Multiple R-squared: 0.006772, Adjusted R-squared: 0.005792
## F-statistic: 6.913 on 1 and 1014 DF, p-value: 0.008685

datos_finales_2$varianza <- exp(df2_varianza$fitted.values)


head(datos_finales_2)

## # A tibble: 6 x 18
## # Groups: ANIO, CCDD, CCPP, CCDI, CONGLOMERADO, NSELUA [6]
## ANIO CCDD CCPP CCDI CONGLOMERADO NSELUA rendimiento uso_fertilizante
## <dbl> <chr> <chr> <chr> <chr> <chr> <dbl> <dbl>
## 1 2019 19 01 02 10672 00018 5.28 1
## 2 2019 19 01 02 10672 00024 3.2 1
## 3 2019 19 01 02 10672 00029 6.19 1
## 4 2019 19 01 02 10672 00040 9.77 1
## 5 2019 19 01 02 10672 00053 3.02 1
## 6 2019 19 01 02 10672 00054 7 1
## # ... with 10 more variables: uso_plaguicida <dbl>, uso_credito <dbl>,
## # riego <dbl>, SUP_TOTAL <dbl>, gasto_fertilizante <dbl>,
## # gasto_plaguicida <dbl>, gasto_semilla <dbl>, gasto_abono <dbl>,
## # FACTOR <dbl>, varianza <dbl>

df2_modelo_Ponderado2 <- lm(rendimiento ~ uso_fertilizante


+uso_plaguicida
+uso_credito
+riego
+SUP_TOTAL
+gasto_fertilizante
+gasto_plaguicida
+gasto_semilla
+gasto_abono, data = datos_finales_2,
weights = 1/varianza)
summary(df2_modelo_Ponderado2)

##
## Call:
## lm(formula = rendimiento ~ uso_fertilizante + uso_plaguicida +
## uso_credito + riego + SUP_TOTAL + gasto_fertilizante + gasto_plaguicida +
## gasto_semilla + gasto_abono, data = datos_finales_2, weights = 1/varianza)
##
## Weighted Residuals:
## Min 1Q Median 3Q Max
## -4.9574 -1.5741 -0.4753 0.8323 11.7175
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 6.68068233 0.39523626 16.903 < 0.0000000000000002 ***
## uso_fertilizante 0.12145624 0.72692318 0.167 0.8673
## uso_plaguicida 2.90885063 0.72659416 4.003 0.00006703 ***

28
## uso_credito 3.77754006 0.84195345 4.487 0.00000807 ***
## riego 1.47069888 0.59740941 2.462 0.0140 *
## SUP_TOTAL 0.00119468 0.00076012 1.572 0.1163
## gasto_fertilizante -0.00005774 0.00008698 -0.664 0.5070
## gasto_plaguicida 0.00008117 0.00004607 1.762 0.0784 .
## gasto_semilla 0.00115136 0.00046332 2.485 0.0131 *
## gasto_abono -0.00003467 0.00005731 -0.605 0.5454
## ---
## Signif. codes: 0 ’***’ 0.001 ’**’ 0.01 ’*’ 0.05 ’.’ 0.1 ’ ’ 1
##
## Residual standard error: 2.502 on 1006 degrees of freedom
## Multiple R-squared: 0.09299, Adjusted R-squared: 0.08488
## F-statistic: 11.46 on 9 and 1006 DF, p-value: < 0.00000000000000022

INTERPRETACIÓN:
Obtenemos la corrección del Modelo 2, si bien es cierto, los signos de las variables independientes no han
cambiado. Pero, se ve una reducción en la mayoría de estimados y de errores estándar.
Asumiendo que el modelo esta correctamente especificado (se cumplen todos los supuestos) podemos inferir
que:
• En el presente modelo de regresión se visualiza que si las variables independientes son 0, entonces el
rendimiento por hectarea aumenta en 668% gracias al intercepto.
• Un cambio en la variable “uso_fertilizante” tiene un efecto positivo del 12% sobre el rendimiento por
hectarea.
• Un cambio en los años de “uso_plaguicida” en una unidad tiene un efecto positivo del 291% sobre el
rendimiento por hectarea.
• Un cambio en los años de “uso_credito” en una unidad tiene un efecto positivo del 377% sobre el
rendimiento por hectarea.
• Un cambio en los años de “riego” en una unidad tiene un efecto positivo del 147% sobre el rentimiento
por hectarea.
• Un cambio en la variable “SUP_TOTAL” en una unidad tiene un efecto positivo del 0.12% sobre el
rendimiento por hectarea.
• Un cambio en los años de “gasto_fertilizante” en una unidad tiene un efecto negativo del 0.006% sobre el
rendimiento por hectarea.
• Un cambio en los años de “gasto_plaguicida” en una unidad tiene un efecto positivo del 0.008% sobre el
rendimiento por hectarea.
• Un cambio en el número de “gasto_semilla” en una unidad tiene un efecto positivo del 0.12% sobre el
rendimiento por hectarea.
• Un cambio en el número de “gasto_abono” en una unidad tiene un efecto negativo del 0.03% sobre el
rendimiento por hectarea.
——————————————————————————
2.3. Normalidad de los residuos a. Modelo 1

qqnorm(df2_modelo_Ponderado2$residuals)
qqline(df2_modelo_Ponderado2$residuals)

29
Normal Q−Q Plot
30
Sample Quantiles

20
10
0
−20

−3 −2 −1 0 1 2 3

Theoretical Quantiles

Prueba de normalidad

shapiro.test(residuales)

##
## Shapiro-Wilk normality test
##
## data: residuales
## W = 0.85571, p-value < 0.00000000000000022

INTERPRETACIÓN: En el modelo 1 se obtiene un p-value menor de 0.05 (0.00000000000000022), no pode-


mos aceptar la hipótesis nula (hipótesis de normalidad). Por lo tanto, podemos suponer anormalidad de los
residuos.
Identificación del dato atípico

which.max(df1_modelo_Ponderado1$residuals)

## 166
## 166

Exclusión del dato atípico

30
shapiro.test(df1_modelo_Ponderado1$residuals[-166])

##
## Shapiro-Wilk normality test
##
## data: df1_modelo_Ponderado1$residuals[-166]
## W = 0.85891, p-value < 0.00000000000000022

INTERPRETACIÓN: Se confirma que los residuos sí se distribuyen de forma normal a excepción de un dato
extremo. Es necesario estudiar en detalle la influencia de esta observación para determinar si el modelo es
más preciso sin ella.

b. Modelo 2

qqnorm(df2_modelo_Ponderado2$residuals)
qqline(df2_modelo_Ponderado2$residuals)

Normal Q−Q Plot


30
Sample Quantiles

20
10
0
−20

−3 −2 −1 0 1 2 3

Theoretical Quantiles

Prueba de normalidad

shapiro.test(residuales2)

##
## Shapiro-Wilk normality test
##
## data: residuales2
## W = 0.84222, p-value < 0.00000000000000022

31
INTERPRETACIÓN: En el modelo 2 se obtiene un p-value menor de 0.05 (0.00000000000000022), no pode-
mos aceptar la hipótesis nula (hipótesis de normalidad). Por lo tanto, podemos suponer que existen algunos
datos atípicos.
Identificación del dato atípico

which.max(df2_modelo_Ponderado2$residuals)

## 166
## 166

Exclusión del dato atípico

shapiro.test(df2_modelo_Ponderado2$residuals[-166])

##
## Shapiro-Wilk normality test
##
## data: df2_modelo_Ponderado2$residuals[-166]
## W = 0.85918, p-value < 0.00000000000000022

INTERPRETACIÓN: Se confirma que los residuos sí se distribuyen de forma normal a excepción de un dato
extremo. Es necesario estudiar en detalle la influencia de esta observación para determinar si el modelo es
más preciso sin ella.
——————————————————————————
2.4. Variables influyentes a. Modelo 1

outlierTest(df1_modelo_Ponderado1)

## rstudent unadjusted p-value Bonferroni p


## 166 4.707342 0.0000028612 0.0029070
## 891 4.486037 0.0000080929 0.0082224
## 100 4.356117 0.0000145970 0.0148300
## 970 4.166959 0.0000335250 0.0340610

INTERPRETACIÓN: Tal como se apreció en el estudio de normalidad de los residuos, las observaciones 166,
100, 891 y 970 tienen un residuo estandarizado mayor que la desviación estándar de otros residuos.

summary(influence.measures(df1_modelo_Ponderado1))

## Potentially influential observations of


## lm(formula = rendimiento ~ uso_fertilizante + uso_plaguicida + uso_credito + riego + SUP_TOTAL
##
## dfb.1_ dfb.us_f dfb.us_p dfb.us_c dfb.rieg dfb.SUP_ dfb.gst_f dfb.gst_p
## 5 0.02 0.02 0.02 0.05 -0.03 0.00 -0.02 0.02
## 69 0.09 -0.04 0.01 0.02 -0.03 -1.17_* -0.05 0.11
## 78 0.00 0.00 0.00 -0.01 -0.01 0.00 0.00 0.00
## 99 0.15 -0.04 -0.04 -0.02 -0.04 -0.02 0.00 0.00
## 100 0.22 -0.06 -0.06 -0.03 -0.05 -0.02 0.00 -0.01
## 101 0.18 -0.05 -0.04 -0.03 -0.04 -0.02 0.00 0.00

32
## 102 0.13 -0.04 -0.03 -0.02 -0.03 -0.01 0.00 0.00
## 108 0.12 -0.03 -0.03 -0.02 -0.03 -0.01 0.00 0.00
## 154 0.00 0.00 0.00 0.00 -0.01 0.00 0.00 0.00
## 160 -0.03 0.00 0.02 -0.04 0.10 0.00 0.02 -0.02
## 162 -0.03 0.02 0.03 -0.03 0.12 0.00 0.00 -0.01
## 166 -0.06 0.04 0.07 -0.05 0.25 0.01 -0.01 -0.01
## 219 -0.03 0.02 0.04 -0.03 0.13 0.00 0.00 -0.01
## 237 -0.02 -0.01 -0.01 0.04 0.01 0.00 0.01 -0.01
## 239 0.01 0.03 0.04 -0.06 -0.10 -0.01 0.01 -0.02
## 243 0.01 0.04 0.04 -0.03 -0.05 0.00 -0.01 -0.01
## 259 0.01 0.04 0.04 -0.05 -0.09 -0.01 0.01 -0.02
## 262 -0.03 0.05 0.02 0.28 -0.07 -0.01 -0.01 0.00
## 265 -0.03 0.02 0.03 -0.03 0.11 0.00 0.00 -0.01
## 340 0.00 0.00 0.01 0.01 0.00 -0.25 -0.01 0.02
## 371 0.01 0.05 0.05 -0.04 -0.07 0.00 -0.01 -0.01
## 388 0.05 -0.03 0.01 0.01 -0.01 -0.81 -0.03 0.07
## 418 0.03 0.05 0.05 0.08 0.00 0.00 -0.01 0.02
## 430 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00
## 466 0.08 -0.05 -0.03 -0.02 0.14 -0.01 0.00 0.00
## 707 0.11 -0.03 -0.03 -0.02 -0.03 0.04 0.00 -0.01
## 709 0.05 0.08 -0.09 -0.01 -0.03 0.02 0.27 -0.15
## 711 0.03 0.02 0.07 0.06 0.01 0.00 0.06 -0.12
## 726 0.01 0.00 0.00 -0.03 -0.01 0.00 -0.01 0.00
## 729 0.03 0.03 0.04 -0.06 0.00 0.00 -0.04 0.03
## 737 0.07 0.20 -0.19 -0.01 -0.05 0.00 -0.04 0.04
## 744 0.00 0.00 0.00 0.01 0.01 0.00 -0.01 0.01
## 747 0.14 -0.04 -0.04 -0.02 -0.03 -0.01 0.00 0.00
## 750 0.01 0.06 0.06 -0.04 -0.07 0.02 -0.01 -0.01
## 752 0.06 -0.17 0.17 -0.04 -0.04 0.01 0.02 -0.04
## 754 0.20 -0.06 -0.05 -0.03 -0.05 -0.02 0.00 -0.01
## 756 0.01 -0.04 0.03 0.00 0.01 0.00 0.10 -0.18
## 759 0.18 -0.05 -0.05 -0.03 -0.04 0.07 0.01 -0.01
## 761 -0.01 -0.01 0.01 0.01 0.01 0.03 0.24 -0.41
## 769 0.02 -0.04 0.03 -0.01 -0.02 0.00 -0.10 0.17
## 770 0.01 0.05 0.05 -0.05 -0.09 0.02 -0.02 -0.01
## 771 0.11 -0.30 0.29 -0.06 -0.06 0.02 0.05 -0.08
## 772 -0.04 0.10 -0.04 0.19 -0.03 0.07 -0.18 0.29
## 773 0.04 -0.06 0.06 -0.02 -0.02 0.01 -0.27 0.46
## 774 0.06 -0.15 0.14 -0.03 -0.03 0.01 -0.04 0.06
## 775 0.08 -0.21 0.22 -0.04 -0.04 0.03 -0.03 0.05
## 776 0.03 -0.16 0.14 0.22 -0.04 -0.01 -0.05 0.09
## 777 0.07 -0.14 0.14 -0.03 -0.04 -0.01 -0.20 0.34
## 778 0.08 -0.24 0.24 -0.05 -0.05 0.10 0.04 -0.06
## 780 0.17 -0.05 -0.04 -0.02 -0.04 -0.02 0.00 -0.01
## 783 0.08 -0.21 0.22 -0.04 -0.04 -0.01 0.03 -0.05
## 785 0.09 -0.23 0.24 -0.04 -0.04 -0.02 0.04 -0.06
## 790 0.11 -0.27 0.27 -0.05 -0.05 -0.02 0.04 -0.07
## 798 0.00 0.03 -0.02 -0.06 0.01 -0.01 0.07 -0.11
## 802 -0.01 0.07 -0.04 -0.01 -0.02 -0.01 -0.11 0.31
## 803 0.00 -0.01 -0.01 -0.02 -0.02 0.00 0.00 -0.01
## 834 0.19 -0.05 -0.05 -0.03 -0.05 -0.01 0.00 -0.01
## 852 0.07 -0.18 0.18 -0.03 -0.03 -0.01 0.03 -0.04
## 891 0.12 -0.01 -0.07 -0.06 -0.04 0.09 1.98_* -1.14_*
## 898 0.13 -0.04 -0.07 0.33 -0.04 -0.02 0.00 0.00

33
## 901 0.18 -0.05 -0.05 -0.03 -0.04 -0.02 0.00 -0.01
## 918 0.12 -0.04 -0.07 0.32 -0.04 0.00 0.00 0.00
## 919 0.04 0.50 -0.15 0.06 -0.14 0.10 -6.48_* -0.68
## 923 0.17 -0.05 -0.04 -0.02 -0.04 -0.02 0.00 0.00
## 924 0.00 0.01 0.01 0.03 0.05 0.00 -0.01 0.02
## 926 0.01 0.01 0.01 -0.05 -0.08 0.00 0.01 -0.02
## 933 0.00 0.00 0.00 0.01 0.01 0.00 0.00 0.00
## 940 0.11 -0.34 0.28 0.00 -0.19 -0.07 0.97 -1.71_*
## 942 0.31 -0.04 -0.06 -0.04 0.02 0.03 0.18 -0.11
## 951 0.20 -0.06 -0.05 -0.03 -0.05 0.00 0.00 -0.01
## 953 0.12 -0.03 -0.03 -0.02 -0.03 0.02 0.00 -0.01
## 968 0.13 -0.04 -0.07 0.34 -0.04 0.02 0.00 0.00
## 969 0.07 0.23 -0.22 -0.01 -0.06 0.05 -0.03 0.03
## 970 0.10 0.31 -0.30 -0.02 -0.08 0.05 -0.06 0.05
## 1011 -0.03 0.06 0.02 0.27 -0.06 0.01 -0.02 0.02
## 1012 0.09 0.28 -0.27 -0.02 -0.07 0.05 -0.02 0.03
## 1013 0.06 -0.03 0.03 -0.02 -0.03 -0.03 -0.64 1.08_*
## dfb.gst_s dfb.gst_b dffit cov.r cook.d hat
## 5 -0.28 0.00 -0.30_* 1.03 0.01 0.04_*
## 69 0.00 0.04 -1.18_* 1.93_* 0.14 0.48_*
## 78 0.03 0.00 0.03 1.04_* 0.00 0.03
## 99 0.00 -0.01 0.15 0.93_* 0.00 0.00
## 100 0.00 -0.01 0.23 0.84_* 0.00 0.00
## 101 0.00 -0.01 0.18 0.90_* 0.00 0.00
## 102 0.00 0.00 0.13 0.95_* 0.00 0.00
## 108 0.00 -0.01 0.12 0.96_* 0.00 0.00
## 154 0.02 0.00 0.02 1.03_* 0.00 0.02
## 160 0.07 0.00 0.17 0.97_* 0.00 0.01
## 162 -0.02 0.00 0.16 0.96_* 0.00 0.00
## 166 -0.11 0.00 0.34_* 0.82_* 0.01 0.01
## 219 -0.04 0.00 0.17 0.96_* 0.00 0.00
## 237 0.10 0.00 0.12 1.05_* 0.00 0.04_*
## 239 0.13 0.01 0.23 0.88_* 0.01 0.00
## 243 -0.05 0.00 0.14 0.96_* 0.00 0.00
## 259 0.07 0.01 0.20 0.89_* 0.00 0.00
## 262 -0.06 -0.03 0.32_* 0.93_* 0.01 0.01
## 265 -0.01 0.00 0.15 0.96_* 0.00 0.00
## 340 0.00 0.01 -0.25 1.15_* 0.01 0.12_*
## 371 -0.06 0.00 0.18 0.92_* 0.00 0.00
## 388 0.00 0.03 -0.81_* 1.49_* 0.07 0.33_*
## 418 -0.56 -0.01 -0.57_* 1.11_* 0.03 0.11_*
## 430 0.00 0.00 0.00 1.05_* 0.00 0.03_*
## 466 -0.01 -0.01 0.18 0.97_* 0.00 0.01
## 707 0.00 0.07 0.15 0.95_* 0.00 0.00
## 709 -0.02 -0.01 0.31_* 1.01 0.01 0.03_*
## 711 -0.45 -0.01 -0.47_* 1.22_* 0.02 0.18_*
## 726 -0.04 0.00 -0.06 1.03_* 0.00 0.02
## 729 -0.36 0.01 -0.38_* 1.12_* 0.01 0.11_*
## 737 -0.02 -0.01 0.24 0.95_* 0.01 0.01
## 744 -0.05 0.00 -0.05 1.03_* 0.00 0.03
## 747 0.00 -0.01 0.14 0.94_* 0.00 0.00
## 750 -0.07 0.00 0.20 0.89_* 0.00 0.00
## 752 0.03 0.00 0.21 0.97_* 0.00 0.01
## 754 0.00 -0.01 0.20 0.89_* 0.00 0.00

34
## 756 -0.01 0.00 -0.18 1.15_* 0.00 0.12_*
## 759 0.00 -0.02 0.20 0.89_* 0.00 0.00
## 761 0.01 -0.01 -0.42_* 1.22_* 0.02 0.18_*
## 769 0.03 0.00 0.19 1.04_* 0.00 0.04_*
## 770 0.02 0.00 0.20 0.88_* 0.00 0.00
## 771 0.02 -0.01 0.36_* 0.87_* 0.01 0.01
## 772 -0.06 -0.01 0.37_* 1.00 0.01 0.03_*
## 773 -0.04 0.00 0.49_* 1.02 0.02 0.05_*
## 774 0.01 0.00 0.21 0.97_* 0.00 0.01
## 775 -0.04 0.00 0.28 0.92_* 0.01 0.01
## 776 -0.01 -0.02 0.33_* 0.96_* 0.01 0.02
## 777 -0.02 0.00 0.43_* 0.95_* 0.02 0.02
## 778 0.00 -0.01 0.31_* 0.92_* 0.01 0.01
## 780 0.01 -0.01 0.17 0.91_* 0.00 0.00
## 783 -0.02 0.00 0.26 0.94_* 0.01 0.01
## 785 -0.02 0.00 0.28 0.93_* 0.01 0.01
## 790 -0.03 0.00 0.33_* 0.90_* 0.01 0.01
## 798 -0.02 0.01 -0.15 1.04_* 0.00 0.04_*
## 802 -0.03 0.00 0.33_* 1.04_* 0.01 0.05_*
## 803 0.10 0.00 0.10 1.08_* 0.00 0.06_*
## 834 0.01 -0.01 0.19 0.89_* 0.00 0.00
## 852 -0.01 0.00 0.22 0.96_* 0.00 0.01
## 891 -0.08 0.19 2.04_* 1.00 0.41 0.17_*
## 898 -0.04 -0.04 0.37_* 0.92_* 0.01 0.01
## 901 0.02 -0.01 0.18 0.91_* 0.00 0.00
## 918 -0.04 -0.04 0.37_* 0.92_* 0.01 0.01
## 919 0.62 0.16 -8.57_* 5.54_* 7.25_* 0.84_*
## 923 0.00 0.00 0.17 0.91_* 0.00 0.00
## 924 -0.18 0.00 -0.19 1.03_* 0.00 0.03_*
## 926 0.18 0.01 0.22 0.97_* 0.00 0.01
## 933 -0.03 0.00 -0.04 1.04_* 0.00 0.03_*
## 940 0.17 -0.02 -1.74_* 1.32_* 0.30 0.29_*
## 942 0.06 -7.10_* -7.14_* 22.44_* 5.08_* 0.96_*
## 951 0.03 -0.01 0.20 0.87_* 0.00 0.00
## 953 0.02 -0.01 0.13 0.96_* 0.00 0.00
## 968 -0.03 -0.05 0.39_* 0.90_* 0.02 0.01
## 969 -0.03 0.00 0.28 0.93_* 0.01 0.01
## 970 -0.03 -0.01 0.38_* 0.86_* 0.01 0.01
## 1011 -0.08 -0.01 0.31_* 0.94_* 0.01 0.01
## 1012 -0.04 -0.01 0.34_* 0.88_* 0.01 0.01
## 1013 -0.08 0.01 1.12_* 1.02 0.12 0.11_*

influencePlot(df1_modelo_Ponderado1)

35
166 891
4
Studentized Residuals

2
0

942
−2

919
−4

0.0 0.2 0.4 0.6 0.8

Hat−Values

## StudRes Hat CookD


## 166 4.707342 0.005208086 0.01136207
## 891 4.486037 0.171017317 0.40741935
## 919 -3.725913 0.840998775 7.24993728
## 942 -1.530470 0.956020534 5.08496140

b. Modelo 2

outlierTest(df2_modelo_Ponderado2)

## rstudent unadjusted p-value Bonferroni p


## 166 4.744821 0.0000023888 0.0024271
## 100 4.450730 0.0000095142 0.0096664
## 754 4.208115 0.0000280540 0.0285030
## 970 4.201548 0.0000288660 0.0293280

INTERPRETACIÓN: Tal como se apreció en el estudio de normalidad de los residuos, las observaciones 166,
100, 754, 970 tienen un residuo estandarizado mayor que las desviaciones estándares de los residuos.

summary(influence.measures(df2_modelo_Ponderado2))

## Potentially influential observations of


## lm(formula = rendimiento ~ uso_fertilizante + uso_plaguicida + uso_credito + riego + SUP_TOTAL
##

36
## dfb.1_ dfb.us_f dfb.us_p dfb.us_c dfb.rieg dfb.SUP_ dfb.gst_f dfb.gst_p
## 5 0.02 0.02 0.02 0.04 -0.03 0.00 -0.02 0.02
## 69 0.10 -0.05 0.01 0.02 -0.03 -1.24_* -0.04 0.10
## 78 0.00 0.00 0.00 0.00 -0.01 0.00 0.00 0.00
## 99 0.16 -0.04 -0.03 -0.02 -0.04 -0.01 0.00 0.00
## 100 0.22 -0.06 -0.05 -0.03 -0.05 -0.02 0.00 -0.01
## 101 0.18 -0.05 -0.04 -0.03 -0.04 -0.02 0.00 0.00
## 102 0.13 -0.03 -0.03 -0.02 -0.03 -0.01 0.00 0.00
## 108 0.12 -0.03 -0.03 -0.02 -0.03 -0.01 0.00 0.00
## 154 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00
## 162 -0.03 0.02 0.03 -0.03 0.11 0.00 0.00 -0.01
## 166 -0.06 0.04 0.07 -0.05 0.25 0.01 -0.01 -0.01
## 219 -0.03 0.02 0.03 -0.03 0.12 0.00 0.00 -0.01
## 237 -0.01 -0.01 -0.01 0.03 0.01 0.00 0.01 -0.01
## 239 0.01 0.03 0.03 -0.05 -0.09 -0.01 0.01 -0.01
## 243 0.01 0.04 0.05 -0.03 -0.06 0.00 -0.01 -0.01
## 259 0.01 0.03 0.04 -0.05 -0.08 0.00 0.01 -0.02
## 262 -0.03 0.06 0.03 0.28 -0.06 -0.01 -0.01 0.00
## 265 -0.03 0.01 0.03 -0.03 0.10 0.00 0.00 0.00
## 340 0.00 -0.01 0.01 0.01 0.00 -0.26 -0.01 0.02
## 371 0.02 0.05 0.06 -0.04 -0.07 -0.01 -0.01 -0.01
## 388 0.06 -0.03 0.01 0.01 -0.02 -0.84 -0.03 0.07
## 418 0.03 0.05 0.05 0.07 0.00 0.00 -0.01 0.02
## 430 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00
## 466 0.08 -0.05 -0.03 -0.02 0.16 -0.01 0.00 0.00
## 707 0.09 -0.02 -0.02 -0.02 -0.02 0.04 0.00 -0.01
## 709 0.03 0.05 -0.06 -0.01 -0.02 0.02 0.26 -0.14
## 711 0.02 0.02 0.07 0.05 0.01 0.00 0.06 -0.12
## 726 0.01 0.00 0.00 -0.03 -0.01 0.00 -0.01 0.00
## 729 0.03 0.03 0.04 -0.05 0.00 0.00 -0.03 0.03
## 737 0.07 0.22 -0.21 -0.01 -0.05 0.00 -0.04 0.04
## 744 0.00 0.00 0.00 0.01 0.01 0.00 -0.01 0.01
## 747 0.17 -0.04 -0.04 -0.03 -0.04 -0.01 0.00 -0.01
## 750 0.02 0.06 0.06 -0.04 -0.07 0.02 -0.01 -0.01
## 752 0.06 -0.17 0.16 -0.04 -0.04 0.01 0.02 -0.03
## 754 0.24 -0.06 -0.05 -0.04 -0.06 -0.02 0.00 -0.01
## 756 0.00 -0.03 0.03 0.00 0.01 0.00 0.10 -0.17
## 759 0.18 -0.05 -0.04 -0.03 -0.04 0.08 0.01 -0.01
## 761 -0.01 -0.01 0.01 0.01 0.01 0.02 0.21 -0.36
## 769 0.01 -0.03 0.02 -0.01 -0.01 0.00 -0.08 0.15
## 770 0.01 0.05 0.05 -0.05 -0.09 0.02 -0.02 -0.01
## 771 0.11 -0.30 0.30 -0.06 -0.06 0.03 0.04 -0.07
## 772 -0.03 0.08 -0.03 0.14 -0.02 0.05 -0.15 0.26
## 773 0.03 -0.04 0.04 -0.01 -0.01 0.01 -0.22 0.39
## 775 0.07 -0.17 0.18 -0.03 -0.03 0.03 -0.04 0.07
## 776 0.02 -0.13 0.12 0.18 -0.03 -0.01 -0.05 0.09
## 777 0.05 -0.10 0.10 -0.03 -0.03 0.00 -0.18 0.32
## 778 0.07 -0.23 0.24 -0.05 -0.04 0.10 0.03 -0.05
## 780 0.18 -0.05 -0.04 -0.03 -0.05 -0.02 0.00 -0.01
## 782 0.11 -0.03 -0.02 -0.02 -0.03 0.00 0.00 0.00
## 783 0.09 -0.23 0.24 -0.04 -0.04 -0.01 0.03 -0.05
## 785 0.10 -0.25 0.26 -0.05 -0.05 -0.02 0.03 -0.06
## 790 0.11 -0.29 0.31 -0.06 -0.06 -0.02 0.04 -0.07
## 798 0.00 0.02 -0.01 -0.05 0.01 -0.01 0.06 -0.10

37
## 802 0.00 0.05 -0.03 -0.01 -0.01 -0.01 -0.07 0.25
## 803 0.00 0.00 -0.01 -0.01 -0.02 0.00 0.00 0.00
## 834 0.19 -0.05 -0.04 -0.03 -0.05 0.00 0.00 -0.01
## 852 0.07 -0.19 0.20 -0.04 -0.04 -0.01 0.03 -0.04
## 891 0.08 -0.04 -0.03 -0.05 -0.03 0.07 1.74_* -0.97
## 898 0.14 -0.04 -0.08 0.42 -0.05 -0.02 0.00 0.00
## 901 0.19 -0.05 -0.04 -0.03 -0.05 -0.02 0.00 -0.01
## 918 0.13 -0.03 -0.07 0.38 -0.04 0.00 0.00 0.00
## 919 0.00 0.40 -0.09 0.06 -0.11 0.08 -5.06_* -0.59
## 923 0.16 -0.04 -0.03 -0.03 -0.04 -0.01 0.00 0.00
## 924 0.00 0.01 0.01 0.03 0.04 0.00 -0.01 0.02
## 933 0.00 0.00 0.00 0.01 0.01 0.00 0.00 0.00
## 940 0.08 -0.26 0.22 0.00 -0.14 -0.05 0.77 -1.42_*
## 942 0.25 -0.03 -0.04 -0.03 0.02 0.03 0.16 -0.09
## 951 0.20 -0.06 -0.05 -0.03 -0.05 0.01 0.00 -0.01
## 953 0.12 -0.03 -0.03 -0.02 -0.03 0.03 0.00 -0.01
## 968 0.12 -0.03 -0.07 0.38 -0.04 0.03 0.00 0.00
## 969 0.06 0.22 -0.21 -0.01 -0.05 0.06 -0.02 0.03
## 970 0.09 0.32 -0.30 -0.02 -0.08 0.06 -0.05 0.05
## 1011 -0.03 0.05 0.02 0.23 -0.05 0.01 -0.02 0.03
## 1012 0.08 0.27 -0.25 -0.02 -0.06 0.05 0.00 0.02
## 1013 0.03 0.00 0.01 -0.02 -0.02 -0.02 -0.50 0.89
## dfb.gst_s dfb.gst_b dffit cov.r cook.d hat
## 5 -0.27 0.00 -0.28 1.03 0.01 0.04_*
## 69 0.01 0.04 -1.24_* 1.89_* 0.15 0.47_*
## 78 0.02 0.00 0.02 1.04_* 0.00 0.03
## 99 0.00 -0.01 0.16 0.92_* 0.00 0.00
## 100 0.00 0.00 0.22 0.83_* 0.00 0.00
## 101 0.00 0.00 0.18 0.89_* 0.00 0.00
## 102 0.00 0.00 0.13 0.94_* 0.00 0.00
## 108 0.00 0.00 0.12 0.96_* 0.00 0.00
## 154 0.01 0.00 0.01 1.03_* 0.00 0.02
## 162 -0.01 0.00 0.15 0.96_* 0.00 0.00
## 166 -0.11 0.00 0.35_* 0.81_* 0.01 0.01
## 219 -0.04 0.00 0.17 0.96_* 0.00 0.00
## 237 0.08 0.00 0.09 1.05_* 0.00 0.04_*
## 239 0.13 0.00 0.21 0.90_* 0.00 0.00
## 243 -0.05 0.00 0.15 0.95_* 0.00 0.00
## 259 0.07 0.00 0.18 0.90_* 0.00 0.00
## 262 -0.06 -0.02 0.32_* 0.93_* 0.01 0.01
## 265 -0.01 0.00 0.14 0.97_* 0.00 0.00
## 340 0.00 0.01 -0.26 1.15_* 0.01 0.13_*
## 371 -0.06 0.00 0.19 0.91_* 0.00 0.00
## 388 0.00 0.03 -0.84_* 1.49_* 0.07 0.33_*
## 418 -0.52 -0.01 -0.53_* 1.10_* 0.03 0.11_*
## 430 0.00 0.00 0.00 1.05_* 0.00 0.04_*
## 466 -0.01 -0.01 0.20 0.96_* 0.00 0.01
## 707 0.00 0.08 0.13 0.96_* 0.00 0.00
## 709 -0.02 -0.01 0.29 1.02 0.01 0.03_*
## 711 -0.41 -0.01 -0.44_* 1.19_* 0.02 0.16_*
## 726 -0.04 0.00 -0.06 1.03_* 0.00 0.02
## 729 -0.34 0.01 -0.36_* 1.12_* 0.01 0.10_*
## 737 -0.03 -0.01 0.26 0.95_* 0.01 0.01
## 744 -0.05 0.00 -0.05 1.03_* 0.00 0.02

38
## 747 0.00 -0.01 0.17 0.92_* 0.00 0.00
## 750 -0.07 0.00 0.20 0.89_* 0.00 0.00
## 752 0.03 0.00 0.20 0.97_* 0.00 0.01
## 754 0.00 -0.02 0.24 0.85_* 0.01 0.00
## 756 0.00 0.00 -0.17 1.15_* 0.00 0.12_*
## 759 0.00 -0.02 0.21 0.88_* 0.00 0.00
## 761 0.01 -0.01 -0.37_* 1.21_* 0.01 0.17_*
## 769 0.02 0.00 0.16 1.04_* 0.00 0.04_*
## 770 0.03 0.00 0.20 0.88_* 0.00 0.00
## 771 0.03 -0.01 0.36_* 0.87_* 0.01 0.01
## 772 -0.05 0.00 0.31_* 1.01 0.01 0.03
## 773 -0.03 0.00 0.42_* 1.03_* 0.02 0.05_*
## 775 -0.04 0.00 0.24 0.93_* 0.01 0.01
## 776 -0.01 -0.02 0.27 0.97_* 0.01 0.01
## 777 -0.02 0.00 0.37_* 0.97_* 0.01 0.02
## 778 0.01 -0.01 0.30 0.92_* 0.01 0.01
## 780 0.02 -0.01 0.19 0.90_* 0.00 0.00
## 782 0.00 -0.01 0.11 0.97_* 0.00 0.00
## 783 -0.02 0.00 0.28 0.93_* 0.01 0.01
## 785 -0.02 0.00 0.31_* 0.92_* 0.01 0.01
## 790 -0.03 -0.01 0.36_* 0.89_* 0.01 0.01
## 798 -0.02 0.00 -0.12 1.04_* 0.00 0.03_*
## 802 -0.03 0.00 0.27 1.05_* 0.01 0.05_*
## 803 0.08 0.00 0.08 1.08_* 0.00 0.07_*
## 834 0.01 -0.01 0.19 0.88_* 0.00 0.00
## 852 -0.01 0.00 0.23 0.96_* 0.01 0.01
## 891 -0.08 0.16 1.77_* 1.07_* 0.31 0.18_*
## 898 -0.05 -0.04 0.46_* 0.89_* 0.02 0.02
## 901 0.02 -0.01 0.19 0.89_* 0.00 0.00
## 918 -0.04 -0.04 0.43_* 0.90_* 0.02 0.01
## 919 0.55 0.14 -6.57_* 5.05_* 4.28_* 0.82_*
## 923 0.00 0.00 0.16 0.91_* 0.00 0.00
## 924 -0.17 0.00 -0.17 1.03_* 0.00 0.03_*
## 933 -0.04 0.00 -0.04 1.04_* 0.00 0.03_*
## 940 0.13 -0.02 -1.44_* 1.32_* 0.21 0.28_*
## 942 0.06 -5.89_* -5.91_* 18.20_* 3.49_* 0.95_*
## 951 0.03 -0.01 0.20 0.86_* 0.00 0.00
## 953 0.02 -0.01 0.13 0.95_* 0.00 0.00
## 968 -0.04 -0.04 0.43_* 0.89_* 0.02 0.01
## 969 -0.03 0.00 0.26 0.93_* 0.01 0.01
## 970 -0.03 -0.01 0.38_* 0.86_* 0.01 0.01
## 1011 -0.07 0.00 0.27 0.94_* 0.01 0.01
## 1012 -0.04 -0.01 0.32_* 0.89_* 0.01 0.01
## 1013 -0.07 0.01 0.92_* 1.05_* 0.08 0.11_*

influencePlot(df2_modelo_Ponderado2)

39
166
100
4
Studentized Residuals

2
0

942
−2

919

0.0 0.2 0.4 0.6 0.8

Hat−Values

## StudRes Hat CookD


## 100 4.450730 0.002392937 0.00466433
## 166 4.744821 0.005303897 0.01175317
## 919 -3.096794 0.818199188 4.27952199
## 942 -1.418171 0.945594745 3.49208549

——————————————————————————

3. ELECCIÓN DEL MEJOR MODELO ECONOMÉTRICO 3.1. Análisis de modelos

mf1 <- summary(df1_modelo_Ponderado1)


mf2 <- summary(df2_modelo_Ponderado2)
#------------------------------------
ee.m1 <- sum(mf1$residualsˆ2)

cbind(mf1$coefficients[,1],
mf2$coefficients[,1])

## [,1] [,2]
## (Intercept) 7.03107514055 6.68068233223
## uso_fertilizante -0.10132779694 0.12145623886
## uso_plaguicida 2.97283191462 2.90885063142
## uso_credito 3.93951385060 3.77754005670
## riego 1.24482582002 1.47069887585

40
## SUP_TOTAL 0.00098192450 0.00119467804
## gasto_fertilizante -0.00005988727 -0.00005773672
## gasto_plaguicida 0.00007213651 0.00008116838
## gasto_semilla 0.00102256489 0.00115136267
## gasto_abono -0.00004127370 -0.00003466711

INTERPRETACIÓN: Podemos observar que en el modelo 1 el intercepto es mayor que en el modelo


2, también observamos que el uso_fertilizante es negativo en comparación al modelo 2; con respecto al
uso_plaguicida y uso_credito son ligeramente mayores en el modelo 1 que en el 2; sin embargo, en el caso
del riego, el modelo 2 presenta mayor estimado que en el 1. Hablando del SUP_TOTAL, en el modelo 2
también sería mayor que en el 1; el gasto_fertilizante y el gasto en abono mantienen su mismo signo para
ambos modelos. Por último, el estimado de gasto_plaguicida y gasto_semilla es mayor en el modelo 2 que
en el modelo 1.

ols_plot_diagnostics(df1_modelo_Ponderado1)

page 1 of 3
Residual vs Predicted Values Outlier and Leverage Diagnostics for rendimient
40 8
Observation
4
RStudent
Residual

20 normal

0 leverage
0 outlier
−4
outlier & leverage
−20
5 10 15 20 0.00 0.25 0.50 0.75 1.00
Predicted Value Leverage
Deleted Studentized Residual

Deleted Studentized Residual vs Predicted


Normal
ValuesQ−Q Plot
6 40
Sample Quantiles

3 Observation 20
normal
0
outlier 0
−3
−20
5 10 15 20 −2 0 2
Predicted Value Theoretical Quantiles

41
page 2 of 3
Observed by Predicted for rendimiento Residual Fit Spread Plot
15
20
rendimiento

Fit − Mean
10
15
5

10 0

5 −5

0 10 20 30 40 50 0.0 0.4 0.8 1.2


Predicted Value Proportion Less

Cook's D Chart Residual Fit Spread Plot


50

6
Cook's D

Residual
25
4

0
2

0 −25
0 250 500 750 1000 0.0 0.4 0.8 1.2
Observation Proportion Less

42
page 3 of 3
Residual Histogram
600

400
y

200

0
−20 0 20 40
Residuals

Residual Box Plot


40
Residuals

20

−20

ols_plot_diagnostics(df2_modelo_Ponderado2)

43
page 1 of 3
Residual vs Predicted Values Outlier and Leverage Diagnostics for rendimient
40 8
Observation
4

RStudent
Residual

20 normal
leverage
0
0 outlier
−4 outlier & leverage
−20
5 10 15 20 25 0.00 0.25 0.50 0.75
Predicted Value Leverage
Deleted Studentized Residual

Deleted Studentized Residual vs Predicted


Normal
ValuesQ−Q Plot
6 40

Sample Quantiles
4
Observation 20
2
normal
0
outlier 0
−2

−4 −20
5 10 15 20 25 −2 0 2
Predicted Value Theoretical Quantiles

44
page 2 of 3
Observed by Predicted for rendimiento Residual Fit Spread Plot
25

20
rendimiento

Fit − Mean
10
15

10 0

0 10 20 30 40 50 0.0 0.4 0.8 1.2


Predicted Value Proportion Less

Cook's D Chart Residual Fit Spread Plot


50
4
Cook's D

Residual
3 25

2
0
1

0 −25
0 250 500 750 1000 0.0 0.4 0.8 1.2
Observation Proportion Less

45
page 3 of 3
Residual Histogram
600

400
y

200

0
−20 0 20 40
Residuals

Residual Box Plot


40
Residuals

20

−20

#——————————————————————————#
IMPORTANTE: Según los modelos planteados para “df1_modelo_Ponderado1” y “df2_modelo_Ponderado2”
obtenemos que los R cuadrados son de 0.08829 (es decir que explica el modelo en 8.8%) y 0.09299 (es
decir que explica el modelo en 9.3%) respectivamente, siendo el modelo mejor explicado el el segundo. Sin
embargo también hacemos un a prueba de AIC para corroborar nuestra elección.
3.2. Prueba AIC del Modelo 1 y 2

AIC(df1_modelo_Ponderado1)

## [1] 7149.354

#-----------
AIC(df2_modelo_Ponderado2)

## [1] 7130.459

INTERPRETACIÓN: El AIC para el modelo1 es de 7149.354, por otro lado el AIC para el modelo2 es de
7130.459. Por ende el modelo que mas se ajusta es el que tiene menor AIC el cual es el modelo2.
——————————————————————————

4. ANÁLISIS DE PRUEBAS DE HIPÓTESIS (Test de significancia)

a. Modelo 2

46
Table 1: Chow test

Res.Df RSS Df Sum of Sq F Pr(>F)


1006 5905.989 NA NA NA NA
1006 6299.825 0 -393.8363 NA NA

summary(df2_modelo_Ponderado2)

##
## Call:
## lm(formula = rendimiento ~ uso_fertilizante + uso_plaguicida +
## uso_credito + riego + SUP_TOTAL + gasto_fertilizante + gasto_plaguicida +
## gasto_semilla + gasto_abono, data = datos_finales_2, weights = 1/varianza)
##
## Weighted Residuals:
## Min 1Q Median 3Q Max
## -4.9574 -1.5741 -0.4753 0.8323 11.7175
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 6.68068233 0.39523626 16.903 < 0.0000000000000002 ***
## uso_fertilizante 0.12145624 0.72692318 0.167 0.8673
## uso_plaguicida 2.90885063 0.72659416 4.003 0.00006703 ***
## uso_credito 3.77754006 0.84195345 4.487 0.00000807 ***
## riego 1.47069888 0.59740941 2.462 0.0140 *
## SUP_TOTAL 0.00119468 0.00076012 1.572 0.1163
## gasto_fertilizante -0.00005774 0.00008698 -0.664 0.5070
## gasto_plaguicida 0.00008117 0.00004607 1.762 0.0784 .
## gasto_semilla 0.00115136 0.00046332 2.485 0.0131 *
## gasto_abono -0.00003467 0.00005731 -0.605 0.5454
## ---
## Signif. codes: 0 ’***’ 0.001 ’**’ 0.01 ’*’ 0.05 ’.’ 0.1 ’ ’ 1
##
## Residual standard error: 2.502 on 1006 degrees of freedom
## Multiple R-squared: 0.09299, Adjusted R-squared: 0.08488
## F-statistic: 11.46 on 9 and 1006 DF, p-value: < 0.00000000000000022

INTERPRETACIÓN: Tenemos que los únicos parámetros significativos son los que presentan un p valor
menor al 5%, los cuales son uso_plaguicida (0.00006703), el uso_credito (0.00000807), riego (0.0140) y
gasto_semilla (0.0131).
——————————————————————————

5. ANÁLISIS DE ESTABILIDAD DE PARÁMETROS 5.1. Realizamos el test de Chow

kable(anova(df1_modelo_Ponderado1, df2_modelo_Ponderado2), caption="Chow test")

INTERPRETACIÓN: Debido a que no hay ningún valor de Chow mayor que F, no habría ningún cambio
estructural en el modelo.

47

You might also like