Velez Fernandez Carolina

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 10

UNIVERSIDAD TÉCNICA DE MANABÍ

FACULTAD DE INGENIERIA AGRICOLA


ASIGNATURA:
ESTADISITICA.

ESTUDIANTE:
VÉLEZ FERNÁNDEZ CAROLINA LISSETH

DOCENTE:
ING. JHONATAN PROAÑO.

PERIODO ACADÉMICO:
OCTUBRE DEL 2023 HASTA ENERO DEL 2024
PROYECTO FINAL DE ESTADISTICA

1. CALCULO DEL TAMAÑO DE LA MUESTRA: Se busca conocer la cantidad de alumnos foráneos que
ingresaron en este periodo, se tenía un valor histórico que el 50% eran foráneos, también se buscó conocer
el gasto mensual en alimentos de los estudiantes, así como la colegiatura que pagan mensualmente.
Buscamos un nivel de confianza del 90% y un margen de error del 8%

Para calcular el tamaño de muestra necesario, utilice la fórmula del tamaño de muestra para una proporción en una
población finita.

La fórmula es:
n = (Z^2 * p * (1-p)) / (E^2)

Con un nivel de confianza del 90% y un margen de error del 8%, podemos sustituir los valores en la fórmula:
n = (1.645^2 * 0.5 * (1-0.5)) / (0.08^2)

Realizando los cálculos:


n = (2.702025 * 0.25) / 0.0064
n = 0.67550625 / 0.0064
n ≈ 105.86

Por lo tanto, el tamaño de muestra necesario sería aproximadamente 106 estudiantes.

Regresión.

2. CALCULO DEL TAMAÑO DE LA MUESTRA: Se busca conocer la cantidad de alumnos foráneos que
ingresaron en este periodo, se tenía un valor histórico que el 50% eran foráneos, también se buscó conocer
el gasto mensual en alimentos de los estudiantes, así como la colegiatura que pagan mensualmente.
Buscamos un nivel de confianza del 90% y un margen de error del 8% en regresión.

Y alumnos no X alumnos
foráneos foráneos
195 4
205 8
215 12
230 16
245 20
270 22
285 24

a= 0.1= t(a/ 2,1,6) = t(0.05,1,6)


t(0.05,1,6)=1.9432
Variable X Y

Media 235.0 15.1429

Suma cuadrados 6750.0 334.8571

Varianza 1125.0 55.8095

Desviación estándar 33.541 7.4706

Error estándar 12.6773 2.8236

Ic 210.3658;259.6342 9.6561;20.6296

Grados de Suma de F p- valué


libertad cuadrados
Regresión 1 311.4815 66.6252 4.0E-4

Residuos 5 4.6751

Total 6

FT (0.1,1,5) =4.0605
FC=66.62552
Coeficiente de determinación.

2
R= 0.9302

Coeficiente de correlación de Pearson.

r= 09645

Error estándar de la estimación


Sx/y = 7.8928

Error estándar alrededor de la línea de regresión

Sr = 0.8827

2
R ajustado

2
R adj = 0.9162

Covarianza muestral

Sxy = 241.6667

Resultados del modelo de la regresión lineal


t (a/ 2,1,5) = t (0.05,1,5) t (0.05,1,5) =2.015
Var Coef Error estándar Límite inferior Límite superior
100% 100%
Intercepción (b) -35.3386 6.2384 -47.9092 -22.768
Var x1 (m) 0.2148 0.0263 0.1618 0.2678

Ŷ=0.2148x-35.3386

R= 0.9645 = 2 = 0.9302
R

R: 0.9645: existe una alta correlación entre las dos variables.

R2%: 93.0192% el modelo lineal es adecuado para explicar la variación de Y y explicado por X.

para calcular el RSME. Primero, necesitamos calcular las predicciones para los alumnos no foráneos. Utilizando la
regresión lineal, obtendremos la siguiente ecuación:

Alumnos no foráneos = 0.1011X + 0.725

Usando esta ecuación, podemos calcular las predicciones para los valores de X. Luego, compararemos estas
predicciones con los valores reales para calcular el RSME.

Aquí están los cálculos:

Para X = 195:
Predicción para alumnos no foráneos: 19.75
Valor real: 4

Para X = 205:
Predicción para alumnos no foráneos: 20.76
Valor real: 8
Para X = 215:
Predicción para alumnos no foráneos: 21.77
Valor real: 12

Para X = 230:
Predicción para alumnos no foráneos: 23.79
Valor real: 16

Para X = 245:
Predicción para alumnos no foráneos: 25.80
Valor real: 20

Para X = 270:
Predicción para alumnos no foráneos: 28.83
Valor real: 22

Para X = 285:
Predicción para alumnos no foráneos: 30.84
Valor real: 24

Ya realizado los cálculos y el RSME para los alumnos no foráneos es de 8.12. Esto significa que, en promedio,
las predicciones tienen un error de aproximadamente 8.12 unidades con respecto a los valores reales.

Anova.
A|B B1 B2
Ʃy=1645.0 Ʃy=106.0
A1 Ŷ=235.0 Ŷ=15.143
S2=1125.0 S2=55.81

A
FILA MUESTRAS SUMA MEDIA VARIANZA

A1 14 1751.0 125.071 13558.841

B
COLUMNA MIUESTRAS SUMA MEDIA VARIANZA

B1 7 1645.0 235.0 1125.0

B2 7 106.0 15.143 55.81

PROMEDIO TOTAL Y VARIANZA TOTAL.

Y.=125.071

S2= 13550.841
TABLA ANOVA

FV SUMA GRADOS DE SUMAS MEDIAS F


CUADRADO LIBERTAD
A 0.0 0 0.0 0.0
B 169180.071 1 169180.071 286.549
INTERACCION 0.0 0 - -
9.22337203685477E15 9.22337203685477E15
ERROR 7084.857 12 590.405
TOTAL 176264.929 13

VALOR CRTITCO F

A: FT (0,12,0.05) =524287.0

B: FT (1,12,0.05) =4.747

INTERACCION: FT (0.12.0.05) =5242287.0

F PROBABILIDAD (p) Valor critico F


A 0.0 0.0 524287.0
B 286.549 0.0 4.747
INTERACCION -9.22337203685477E15 0.0 524287.0
Anova de un factor

ANOVA de un factor ( Welch)

A N Media DE EE
A 7 235.0 33.54 12.68
B b 7 15.1 7.47 2.82

COMPROBACIONES DE SUPUESTOS

Prueba de normalidad (Shapiro- Wilk)


W p
B 0.957 0.680

Nota. Un valor p bajo sugiere una


Violación del supuesto de normalidad

Prueba de levene para homogeneidad de varianzas


F g/1 g/2 p

B 11.1 1 12 0.006

PRUEBAS POST HOC

Prueba Post-HOC de Games –Howell-B


a b

a diferencia de medidas valor p 220


<.001
-
b diferencia de medidas valor p -
DESCRIPTIVAS

C B

N NO FORANEOS 6
NO FORANEOS 1
FORANEOS 7
PERDIDOS NO FORANEOS 0
NO FORANEOS 0
FORANEOS 0
MEDIA NO FORANEOS 233
NO FORANEOS 245

FORANEO 15.1
MEDIANA NO FORENAEO 223
NO FORANEO 245
FORANEO 16
DESVIACION ESTANDAR NO FORANEO 36.4
NO FORANEOS NaN
FORANEO 7.47
MINIMO NO FORANEOS 195

NO FORANEO 245
FORANEOS 4
MAXIMO NO FORANEOS 285
NO FORANEOS 245
FORANEOS 24
W de Shapiro-Wilk NO FORANEOS 0.904
NO FORANEOS NaN
FORANEOS 0.95Q

Valor p de Shapiro-Wilk NO FORANEOS 0.398


NO FORANEOS NaN
FORANEOS 0.727

ANOVA DE UN FACTOR (NO PARAMÉDICO)

Kruskal- Wallis

x² gl p
B 9.87 2 0.007
COMPARACIONES DOS A DOS DWASS-STEEL-CRITCHLOW-FLIGNER.

Comparaciones entre parejas –B

W p

No foráneos no foráneos 0.707 0.872


No foráneos no foráneos -4.243 0.008
No foráneos foráneos -2.160 0.278

REGRESION LINEAL

Medidas de ajuste del Modelo


Modelo R R² R² corregida RMSE

1 0.980 0.960 0.953 22.3

Coeficiente del Modelo – B

Predictor Estimador EE t p

Constante* 233.3 10.3 22.709 < 001


C

No foráneos – no foráneos 11.7 27.2 0.429 0.676

ANOVA MULTIFACTORIAL.
CONCLUSIONES:
Cálculo del Tamaño de la Muestra:

Se buscó conocer la cantidad de alumnos foráneos que ingresaron en este periodo.


Con un nivel de confianza del 90% y un margen de error del 8%, el tamaño de muestra necesario sería aproximadamente
106 estudiantes.
Regresión
Se utilizó la regresión lineal para analizar la relación entre la cantidad de alumnos foráneos y variables como el gasto
mensual en alimentos y la colegiatura.
La ecuación de regresión obtenida fue Ŷ = 0.2148X - 35.3386.
El coeficiente de determinación (R²) fue 0.9302, indicando que el modelo explica el 93.02% de la variabilidad en la
variable dependiente.
El error estándar de la estimación fue Sx/y = 7.8928 y el error estándar alrededor de la línea de regresión fue Sr = 0.8827.
La correlación de Pearson (r) fue 0.9645, mostrando una alta correlación entre las variables.
Cálculo del RSME:
Se calculó el RSME para evaluar la precisión del modelo de regresión.
El RSME para los alumnos no foráneos fue de 8.12, lo que indica un error promedio de aproximadamente 8.12 unidades
en las predicciones con respecto a los valores reales.
ANOVA:
Se realizó un análisis de varianza (ANOVA) para evaluar las diferencias entre grupos.
El valor F para la variable B fue 286.549 con una significancia de p < 0.05, indicando diferencias significativas entre
grupos.
Se verificó la homogeneidad de varianzas y normalidad de los datos.
Pruebas Post Hoc:
Se realizaron pruebas post hoc de Games-Howell-B para comparaciones entre grupos.
Se presentaron las diferencias significativas entre los grupos.
Anova de un Factor (Welch):
Se aplicó ANOVA de un factor con Welch para evaluar las diferencias entre grupos con tamaños de muestra desiguales.
Se proporcionaron estadísticas descriptivas y pruebas de comprobación de supuestos.
Pruebas de Normalidad y Homogeneidad de Varianzas:
Se realizaron pruebas de Shapiro-Wilk y Levene para verificar los supuestos de normalidad y homogeneidad de varianzas,
respectivamente.
Kruskal-Wallis y Comparaciones Dwass-Steel-Critchlow-Fligner:
Se aplicó el test Kruskal-Wallis para datos no paramétricos.
Se realizaron comparaciones dos a dos con Dwass-Steel-Critchlow-Fligner.
Regresión Lineal (No Foráneos - No Foráneos:
Se presentaron medidas de ajuste del modelo y coeficientes para la variable "No Foráneos - No Foráneos".
En conclusión, los análisis proporcionan una comprensión detallada de la relación entre las variables estudiadas, la validez
del modelo de regresión, y las diferencias significativas entre grupos. Los resultados indican la relevancia de las variables
consideradas y proporcionan información útil para la toma de decisiones.
En conclusión, el anova multifactorial te permite determinar si hay diferencias significativas entre los grupos o factores
que estás analizando. Si el valor de F es mayor que el valor crítico y el p-valor es menor que el nivel de significancia
elegido (generalmente 0.05), puedes concluir que hay diferencias significativas entre al menos dos de los grupos o
factores.

El ANOVA multifactorial también te permite identificar los efectos principales de cada factor. Si el valor de F para un
factor es significativo, significa que ese factor tiene un efecto significativo en la variable de respuesta. Gracias

También podría gustarte