Fase 2

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 16

Fase 2 - Identificación de variables estadísticas

Presentado por

Vanesa García Bonilla

Docente
Mabel Ximena Velásquez Molano
Grupo
4

Universidad Nacional Abierta y a Distancia


UNAD
2024
Contenido

Explicar en sus propias palabras:


a. Diligencie el siguiente cuadro indicando la diferencia de cada variable:
Variables cuantitativas Variables categóricas o nominales
Continua Discreta Nominal Ordinal
Son variables que Son variables que Son variables que Son variables que
pueden tomar solo pueden tomar representan representan
cualquier valor valores enteros y no diferentes categorías categorías con un
dentro de un rango, pueden ser que no tienen un orden específico.
y pueden ser fraccionadas. orden inherente. Por Por ejemplo, nivel
fraccionadas en Ejemplos son la ejemplo, colores educativo
valores infinitos cantidad de hijos,
como por ejemplo
las que incluyen la
altura, el peso

b. Defina los siguientes tipos de muestreo:


• Muestreo aleatorio simple: cada miembro de la población tiene la misma
probabilidad de ser seleccionado en este muestreo se eligen individuos de la
población de forma aleatoria y sin ningún tipo de restricción.

• Muestreo estratificado: En este método, la población se divide en subgrupos


homogéneos llamados estratos y luego se selecciona una muestra de cada
estrato de forma proporcional a su tamaño en la población total.

• Muestreo por conglomerados: En este tipo de muestreo, la población se


divide en grupos o conglomerados y se seleccionan algunos de estos
conglomerados al azar para formar la muestra. Luego se recopilan datos de
todos los individuos dentro de los conglomerados seleccionados

• Muestreo sistemático: En este método, se selecciona un elemento aleatorio


como punto de partida y luego se elige sistemáticamente cada elemento de la
población para formar la muestra
c. Indique los aspectos a tener en cuenta para elegir un tamaño de muestra
adecuado.
Respuesta/
Nivel de confianza: El nivel de confianza deseado para la estimación de parámetros
estadísticos.
Margen de error: La amplitud máxima aceptable para la diferencia entre el valor
estimado y el valor real del parámetro.
Variabilidad de la población: La variabilidad intrínseca de la población que se está
estudiando.
Técnica de muestreo: El tipo de muestreo que se va a utilizar y su influencia en el
tamaño de muestra requerido.
d. Qué es la Regla de Sturges ¿para qué sirve?
Es una regla empírica utilizada en estadística para determinar el número óptimo de
clases en un histograma. Se calcula como 1 + log2(N), donde N es el tamaño de la muestra.
e. En el siguiente cuadro indique la diferencia de cada tabla de frecuencia:
Table de frecuencias
Absolutas Relativas Absolutas Relativas
acumuladas acumuladas
Muestra el número Expresa la Es la suma Es la suma
de veces que ocurre frecuencia de cada acumulativa de las acumulativa de las
cada valor en un valor como un frecuencias frecuencias relativas
conjunto de datos. porcentaje del total absolutas a medida a medida que
de observaciones que avanzamos a avanzamos a través
través de los valores de los valores en
en orden. orden.

f. ¿Cómo se deben organizar los datos en una tabla de frecuencias absolutas para
una variable continua?
Determinar los límites de clase: Definir los intervalos en los que se agruparán los
datos.
Contar las observaciones en cada intervalo: Determinar cuántas observaciones caen
en cada intervalo.
Calcular la frecuencia absoluta: Indicar cuántas veces se repite cada intervalo.
Presentar los datos en una tabla: Mostrar los límites de clase, la frecuencia
absoluta y, opcionalmente, la frecuencia relativa y acumulada.

g. Rellene el siguiente cuadro con 5 ejemplos de variables continuas, discretas y


cualitativas relacionadas con su programa de estudio:
Variable Cuantitativa Cuantitativa discreta Cualitativa o
continua categórica
1 Peso de un animal. Número de crías por Raza del animal.
camada.

2 Altura de un animal. Cantidad de vacunas Color del pelaje.


administradas.
.
3 Producción de leche Número de veces Condición de salud
por día. que un animal ha (saludable, enfermo,
sido preñado. convaleciente).

4 Temperatura Cantidad de huevos Tipo de


corporal de un puestos por día. alimentación
animal. (forraje,
concentrado,
mixto).

5 Consumo de Número de Clasificación del


alimento en tratamientos tipo de reproducción
kilogramos por médicos recibidos (sexual, asexual).
semana

2. El director de curso le suministrará en el foro de discusión una base de datos de


una variable cuantitativa continúa relacionada con una problemática de interés nacional;
con estos datos halle los siguientes parámetros estadísticos manualmente (no debe usar
ningún tipo de software):
Punto 2. Variable cuantitativa continua En Guayabal de Síquima, predomina el
minifundio; se realizó un muestreo de 50 campesinos que se dedican a la actividad
agropecuaria y se les preguntó el área de sus parcelas (en fanegadas):

a. Media muestral.
Formula
Sumamos todos los valores de la muestra y luego dividimos entre
el número total de observaciones, que es 50. Así pues, aplicamos la
fórmula de la media muestral:
Sustituimos la formula quedando así
𝑥1 + 𝑥2 + 𝑥3 + 𝑥4 …
𝑥̅ =
𝑛
389.2
𝑥̅ = = 7.8
50

b. Mediana
Se ordenan de mayor a menor y aplicamos la formula para hallas la mediana

2,7, 4,6, 5,1, 5,5, 5,7, 5,8, 5,9, 6,4, 6,4, 6,6, 6,6, 6,7, 6,7, 6,7, 6,8, 6,8, 6,9, 7,1,
7,3, 7,3, 7,4, 7,4, 7,4, 7,6, 7,7, 7,9, 7,9, 7,9, 8, 8, 8,1, 8,2, 8,2, 8,2, 8,3, 8,3, 8,4,
8,4, 8,6, 8,6, 8,9, 8,9, 9, 10,2, 10,9, 11,1, 11,1, 11,3, 11,7, 12
𝑛+1
2

50 + 1
= 25.5
2
M=7.8

c. Varianza.

Var= 3.36

d. Desviación estándar.

1.8
e. Rango de datos.

9.3
f. Valor de los cuartiles 1, 2 y 3

𝑘 ∗ (𝑛 + 1)
4

1 ∗ (50 + 1)
= 12.75
4

2 ∗ (50 + 1)
= 25.5
4

3 ∗ (50 + 1)
= 38.25
4

g. Rango intercuartílico.

IQR= 38.25 – 12.75 = 25.5

h. Presente la tabla de frecuencias absolutas (utilice la Regla de Sturges),


frecuencias relativas, frecuencias absolutas acumuladas y frecuencias relativas
acumuladas.

Lim inf Lim Sup Marca de clase fi FI hi HI


2,7 4,7 3,7 2 2 0,04 0,04
4,7 6,7 5,7 9 11 0,18 0,22
6,7 8,7 7,7 29 40 0,58 0,8
8,7 10,7 9,7 4 44 0,08 0,88
10,7 12,7 11,7 6 50 0,12 1
12,7 14,7 13,7 0 50 0 1
14,7 16,7 15,7 0 50 0 1
50 1

i. Realice el Diagrama de cajas (Boxplot)

3. El director de curso le suministrará en el foro de discusión una base de datos de


una variable cuantitativa discreta relacionada con una problemática de interés nacional, con
estos datos halle los siguientes parámetros estadísticos manualmente (no debe usar ningún
tipo de software):
Uno de los medios de subsistencia en la región, es la cría de cerdos criollos; por lo
tanto, se le preguntó a cada campesino cuántos tenían:

a. Media muestral.
219
𝑥̅ = = 4.38
50

b. Mediana.
1,1,1,1,1,1,2,2,2,2,2,3,3,3,3,4,4,4,4,4,4,4,4,4,5,5,5,5,5,5,5,5,6,6,6,6,6,6,6,6,6,6,6,
7,7,7,7,8,8
𝑛+1
2

50 + 1
= 25.5
2
M=5

d. Varianza.
Var=3.9

e. Desviación estándar.

1.9
f. Rango de datos.

R= 7
g. Valor de los cuartiles 1, 2 y 3

i. Rango intercuartílico.

j. Presente la tabla de frecuencias absolutas, frecuencias relativas, frecuencias


absolutas acumuladas y frecuencias relativas acumuladas.

k. Realice el Diagrama de cajas (Boxplot)

4. El director de curso le suministrará en el foro de discusión una base de datos con dos
variables, una cualitativa nominal y otra cualitativa ordinal, relacionada con una
problemática de interés nacional, con estos datos realice los siguientes ejercicios
manualmente (no debe usar ningún tipo de software):
• Presente la tabla de frecuencias absolutas y frecuencias relativas de la variable
cualitativa nominal.

• Presente la tabla de frecuencias absolutas y frecuencias relativas de la variable


cualitativa ordinal.

5. Ejecute el script de la Fase 2 en el Programa R (revise el tutorial suministrado por el


director de curso para el manejo del programa). El script está diseñado para analizar los
mismos datos que se le suministraron en los puntos 2, 3 y 4
• Identifique los comandos del script que producen los estadísticos que calculó
manualmente (en el script encuentra la explicación de cada comando ejecutado) y
diligencie el siguiente cuadro comparando el valor calculado manualmente con el
producido con el script

Estadístico Variable continua Variable discreta


Manual Programa R Manual Programa R
Media 7.8 7.784 4.3 4.38
muestral.
Mediana. 7.8 7.800 5 5.00
Varianza. 3.36 3.365045 3.9 3.913878
Desviación 1.8 1.834406 1.9 1.978352
estándar
Cuartiles 1 y 3 6.700 - 8.400 3.00 - 6.00

6. Presente los gráficos obtenidos al ejecutar el script, realizando una breve


descripción y análisis de los resultados de cada uno:
a. Gráficos de la variable cuantitativa continua:
• Histograma de la variable continua
• Histograma de frecuencias relativas acumuladas

• Boxplot o diagrama de cajas variable continua

Variable cuantitativa continua En Guayabal de Síquima, predomina el minifundio;


se realizó un muestreo de 50 campesinos que se dedican a la actividad agropecuaria y se les
preguntó el área de sus parcelas (en fanegadas):
Realizando el análisis de los datos obtenidos vemos que el 50% de los campesinos poseen
parcelas con áreas entre 7 y 8 fanegadas
b. Gráficos de la variable cuantitativa discreta:
• Diagrama de barras Frecuencia Absoluta

Nos indica que el numero de cerdos que más se repite son 6, al igual podemos
analizar que más del 50% poseen en promedio de 4 a 6 cerdos Diagrama de barras

Frecuencias relativas acumuladas

Esto nos indica que el campesino que más posee cerdos no supera los 8 animales
• Boxplot o diagrama de cajas variable discreta

c. Gráficos de la variable cualitativa nominal:


Los datos se codificaron de la siguiente manera:
1= plátano
2= fríjol
3= aguacate
4= tomate de árbol
5= otro cultivo
6= no tienen ningún cultivo

• Diagrama de barras frecuencias absolutas


El cultivo que más se repite entre las respuesta de los campesinos es el cultivo de
plátano

• Diagrama de barras frecuencias relativas

Nos indica que más de 25% de los campesinos poseen cultivo de plátano

• Gráfico de tarta

d. Gráficos de la variable cualitativa ordinal:


Los datos se codificaron de la siguiente manera:
1= primaria
2= secundaria
3= profesional – técnico/tecnólogo
4= profesional universitario

• Diagrama de barras frecuencias absolutas


• Diagrama de barras frecuencias relativas

Nos indica que más de un 35% lograron terminar su primaria, un 30% terminaron la
secundaria y que menos del 15% son profesionales

• Gráfico de tarta
Conclusiones
Conocer el manejo del programa R nos agiliza el manejo de los datos de una investigación,
logrando una interpretación más clara de estos
El uso de estadística y probabilidad en ciencias agrícolas es fundamental para optimizar
procesos, tomar decisiones informadas y mejorar la productividad. Mediante el análisis de
datos y la aplicación de modelos probabilísticos, los agricultores pueden prever riesgos,
mejorar la calidad de los cultivos y aumentar la eficiencia en la producción agrícola,
contribuyendo así al desarrollo sostenible del sector y a la seguridad alimentaria

Referencias Bibliográficas

Balzarini Mónica, Di Rienzo Julio, Tablada Margot, Gonzalez Laura, Bruno Cecilia, Córdoba
Mariano, Walter Robledo y Casanoves Fernando. 2015. Estadística y biometría:
ilustraciones del uso de InfoStat en problemas de agronomía. https://elibro-
net.bibliotecavirtual.unad.edu.co/es/lc/unad/titulos/78127

García, P. A. (2014). La interpretación de los datos: Una introducción a la estadística


aplicada. Biblioteca virtual UNAD. https://elibro-
net.bibliotecavirtual.unad.edu.co/es/ereader/unad/48802

También podría gustarte