Asignación: Diseño de Experimentos/ Práctica Python
El siguiente conjunto de datos agronómicos permite usar la misma entrada para ajustar diferentes
modelos haciendo uso esta vez del programa Python usando cualquier plataforma.
La matriz de datos contiene las variables
y: latitud
x:Longitud
SMI: Índice de humedad del suelo
NDVI: Indice de vegetación de diferencia normalizado
LST: Temperatura en la superficie del suelo
El siguiente código en R representa el conjunto de datos
Se pide:
1- Convertir el código R en Python para generar un data.frame de manera análoga
2- Graficar la nube de puntos (solo coordenadas)
3- Asignar al gráfico un tamaño al punto de acuerdo con el SMI (graficar)
4- Asignar al gráfico un color al punto de acuerdo con el NDVI (graficar)
5- Asignar al gráfico una forma al punto de acuerdo con el LST(graficar)
6- Buscar alguna librería o programa(en última opción) que permita visualizar los puntos en
el mapa de Colombia (¿están todos los puntos en Colombia? ¿pertenecen los puntos a
alguna región específica de Colombia? ¿están todos los puntos dentro de esa región? Si
alguno se sale de esa región (departamento), decartarlo y volver a graficar.
7- Realice un boxplot para SMI
8- Realice un histograma para NDVI
9- Grafique la densidad para LST
10- Calcule estadísticas descriptivas para las 3 variables
11- Fracciones los datos de latitud en 4 cuadrantes y etiquete los puntos como (I,II,II y IV)
según el cuadrante y cree esta nueva variable(cuadrante como tipo factor o cadena) y
calcule las estadísticas descriptivas por cuadrante
12- Realice un boxplot para SMI que muestre las cajas de los 4 cuadrantes en el mismo gráfico
13- Realice un histograma múltiple para NDVI que los muestre para los 4 cuadrantes en el
mismo gráfico (superponiendo los histogramas)
14- Realice un gráfico de densidades múltiple para LST que los muestre para los 4 cuadrantes
en el mismo gráfico (superponiendo las densidades)
15- Construya una matriz de correlaciones de Pearson para las 5 variables
16- Realice un gráfico de correlaciones para las 5 variables
17- Fraccione el gráfico de correlaciones por cuadrante y muestre las 4 figuras en un solo
gráfico
18- Ajuste algún modelo de regresión lineal simple entre el NDVI (respuesta) y el LST
19- Ajuste un modelo de regresión multiple entre NDVI (respuesta) con LST y SMI
20- Tome una muestra del 80% del data.frame y calcule la matriz de correlaciones por
cuadrante. Compare con el caso de todos los datos.
21- Haga un gráfico 3D para las 3 variables ambientales
22- Haga un gráfico 3D para las 3 variables ambientales y asigne color según cuadrante
23- Investigue como se construye una matriz de distancias entre todos las coordenadas
24- Ubique el centroide de toda la nube de puntos de coordenadas y seleccione solo puntos
en una ventana de radio a lo sumo igual a 2/3 de la máxima distancia en la matriz de
distancias
25- Calcule estadísticas descriptivas en esta ventana circular (dibuje la ventana) y asigne un
color diferente a los puntos dentro de esta ventana
26- Suponga que queremos hacer un análisis de varianza para comparar la media de SMI por
cuadrante. Se pide primero tomar aleatoriamente 10 datos de cada cuadrante y construir
un nuevo data.frame con todas las variables pero solo con 40 filas. Utilice el análisis de
varianza (modulo pingouin si desea) para comparar el índice medio de los 4 cuadrantes.
27- Use alguna librería que permita extraer los residuales del modelo y haga su histograma
28- Utilice la prueba de Shapiro para probar normalidad en los residuales
29- Utilice la prueba de Levine para probar igualdad de varianzas de los residuales
30- Investigue como se calcula el índice de Moran y pruebe si los residuales muestran
dependencia atribuible a la autocorrelación espacial entre ellos.
En cada punto se pide hace alguna interpretación o comentario de lo obtenido de a lo
sumo dos líneas dentro del mismo código. Se pide en la cuenta del GitHub subir todo el
trabajo de modo que sea revisable desde internet en la web.
El trabajo se hace en grupos de dos estudiantes. Si alguno quiere trabajar solo se acepta.
Este equivale a una evaluación parcial. Pueden usat Google Colaborativo o Jupiter. Todo es
en Python. Los monitores y yo estaremos para ayudarles.