ESTADÍSTICA GENERAL Ejercitación de Repaso General
ESTADÍSTICA GENERAL Ejercitación de Repaso General
ESTADÍSTICA GENERAL Ejercitación de Repaso General
𝑋̅ − 20
𝑃 < 2,602
𝑆 2
√
[ 16 ]
15. ¿Cuál es la forma genérica de un intervalo de confianza para μ?
16. ¿Cómo se modifica la precisión del intervalo de confianza para μ si aumenta la varianza
de X, si se cambia el nivel de confianza elegido, o si se aumenta el tamaño de la muestra?
17. ¿Cuál es el estadístico de prueba apropiado para poner a prueba la hipótesis nula H0)
μ ≥ 25?
18. ¿Cómo de calcula el valor p para poner a prueba la hipótesis nula H0) μ ≥ 25?
19. ¿Cuál es, en este caso, la verdadera distribución de probabilidad del estadístico de prueba
apropiado para poner a prueba la hipótesis nula H0) μ ≥ 25? (Ayuda: ver página 153)
1
Ejercicio 2. Un fitotecnista ensaya un nuevo híbrido de girasol para decidir si conviene
introducirlo en el norte de Santa Fe. Para ello, se dispone a seleccionar al azar un cierto número
de lotes agrícolas dentro de la región, cultivar en cada lote el híbrido en cuestión y registrar
los rendimientos que obtenga en cada uno. Con los rendimientos que registre calculará la
media muestral y la varianza muestral (estimador insesgado de la varianza poblacional) y a
partir de dichos estadísticos construirá un intervalo de confianza 0,95 para la media
poblacional de los rendimientos de dicho híbrido en los lotes agrícolas de la región.
1. Identificar la población de referencia, la muestra y las variables aleatorias a registrar.
2. Explicar por qué las variables aleatorias a registrar son independientes y con idéntica
distribución de probabilidad.
3. ¿Qué valores tendrán la esperanza y la varianza de dichas variables aleatorias?
4. Explicar por qué la media muestral y la varianza muestral son variables aleatorias.
5. ¿Qué es la esperanza de la media muestral? ¿Cuál será su valor?
6. ¿Qué es la varianza de la media muestral? ¿Cuál será su valor? ¿Cómo lo estimará el
fitotecnista?
7. ¿Por qué es correcto afirmar que la media muestral es un estimador insesgado y
consistente de la media poblacional?
8. ¿Por qué es correcto afirmar que la varianza muestral es un estimador insesgado y
consistente de la varianza poblacional?
9. ¿A qué modelo se aproxima la distribución de probabilidad de la media muestral?
10. ¿De qué depende la probabilidad de que la media muestral tome un valor cercano al de
la media poblacional?
11. ¿Qué riesgo corre el fitotecnista de producir un intervalo que no contenga el valor de la
media poblacional? ¿Cómo hace para controlar fijar ese riesgo?
Ejercicio 3. Una serie de mediciones del contenido de hidrocarburos en los gases de escape
(ppm) de 15 autos de 10 años de antigüedad matriculados en Buenos Aires tomados al azar
produjo los siguientes valores:
Hidrocarburos (ppm) 381 – 261 − 552 − 207 − 729 − 295 − 511 − 425 − 414 − 382 − 403 −
523 − 391 − 575 − 599
1. Identificar la población de referencia, la variable de interés y la muestra aleatoria obtenida.
2. Calcular estimaciones puntuales de la media poblacional y de la varianza poblacional de
los contenidos de hidrocarburos en los gases de escape de los autos de la población de
referencia.
3. Explicar qué es la media poblacional en este caso particular.
4. Dando por cierto que los valores registrados son realizaciones de variables aleatorias
independientes con idéntica distribución Normal, construir un intervalo de confianza 0,99
para la media poblacional de los contenidos de hidrocarburos en los gases de escape de
los autos de la población de referencia.
En relación con la precisión del intervalo de confianza 0,99 construido,
5. ¿Cómo será la precisión de un intervalo de confianza 0,95 construido con los mismos
datos? Verificarlo con el cálculo apropiado.
6. ¿Cómo será la precisión de un intervalo de confianza construido con una muestra de
tamaño n = 20? Verificarlo incorporando a la muestra los siguientes 5 nuevos registros y
luego calculando un nuevo intervalo de confianza con los 20 datos.
Hidrocarburos (ppm) 476 − 510 − 556 − 276 − 648
7. ¿Cómo será la precisión de un intervalo de confianza construido con datos en los que por
descuido se incluyeron 4 autos de 20 años de antigüedad?
Ejercicio 4. Una asociación de defensa del consumidor denuncia que una empresa arrocera
vende paquetes etiquetados como de 1kg que en realidad pesan en promedio menos que 1 kg.
Para establecer si es razonable aceptar esta denuncia, el juzgado que interviene pide el
asesoramiento de peritos estadísticos que proponen obtener y examinar una muestra aleatoria
de 15 paquetes de arroz entregados por la empresa en cuestión a la distribuidora. Con los pesos
2
de los paquetes a incluir en la muestra, se disponen a estimar el promedio y la varianza de
todos los pesos de los paquetes producidos por la empresa y a realizar una prueba de hipótesis
apropiada para juzgar el caso.
1. Identificar las unidades muestrales, la muestra y las variables aleatorias involucradas en
este problema. ¿Por qué causas se trata de variables aleatorias independientes?
2. ¿Qué experimento aleatorio genera las variables aleatorias en cuestión?
3. Formular hipótesis verbales y estadísticas apropiadas para juzgar el caso.
4. Seleccionar un nivel de significación apropiado. Explicar qué implica el valor elegido.
Una vez obtenida la muestra y realizadas las mediciones los pesos de los paquetes resultan ser
los siguientes (en gramos):
987 995 1003 945 1002 968 1002 997 1005 987 985 1007 1009 979 1003
5. Calcular el valor p. Explicar que mide y cómo se define.
6. Concluir la prueba de hipótesis y explicar la conclusión en términos del problema
particular.
7. ¿A qué población se extiende la inferencia realizada?
8. ¿Qué error se puede haber cometido? ¿Qué consecuencias tendría? ¿De qué depende el
riesgo de ese tipo de error?
3
8. Bajo qué supuestos son válidos la prueba de hipótesis realizada y el intervalo de confianza
construido.
90
𝑥̅ = 205
80 𝑦̅ = 54,4
15
Num. de especies exóticas
70
∑(𝑥𝑖 − 𝑥̅ )2 = 474.000,00
60
𝑖=1
50
15
40 ∑(𝑥𝑖 − 𝑥̅ ) ∙ (𝑦𝑖 − 𝑦̅) = −32.230,00
30 𝑖=1
15
20
∑(𝑦𝑖 − 𝑦̅)2 = 2.849,60
10
𝑖=1
0 15
0 100 200 300 400 500 600
Distancia al puerto (km)
∑[𝑦𝑖 − (𝑏0 + 𝑏𝑖 ∙ 𝑥𝑖 )]2 = 658,10
𝑖=1
4
Frecuencias absolutas (plantas)
Tipo de suelo Hojas
Pubescentes Glabras
Calcáreo 12 22
No calcáreo 16 50
A partir de estos datos,
3. Estimar y comparar las frecuencias relativas de las plantas con hojas pilosas en los suelos
calcáreos y en los suelos no calcáreos.
4. Explicar por qué existe incertidumbre en las estimaciones anteriores.
5. ¿Qué tipo de prueba de hipótesis corresponde realizar para determinar si las diferencias
entre las frecuencias relativas observadas de las plantas con hojas pilosas en los suelos
calcáreos y en los suelos no calcáreos son significativas?
6. Llevar a cabo la prueba hipótesis con un nivel de significación α = 0,05.
7. Escribir la conclusión de la prueba de hipótesis en términos del problema.
8. Explicar qué error se puede haber cometido e indicar cómo se hubiera podido disminuir
el riesgo de cometerlo.
5
al azar 10 lotes agrícolas dentro del partido, dividirá cada lote en dos, en una mitad cultivará
soja con labranza convencional y en la otra mitad cultivará soja con siembra directa. Durante
el tercer mes de cultivo, procederá a medir la respiración del suelo en cada mitad.
1. Identificar las unidades muestrales, la muestra y las variables aleatorias involucradas en
este procedimiento.
2. Escribir las hipótesis verbales de la comparación propuesta y formular las hipótesis
estadísticas correspondientes. Explicar a qué corresponden los parámetros incluidos en
las hipótesis estadísticas.
Luego de realizado el experimento, los datos obtenidos son los siguientes:
Respiración del suelo [mg CO2 liberado / día /100 g de suelo]
Lote 1 2 3 4 5 6 7 8 9 10
Lab. Conv. 82,5 96,8 99,7 86,2 95,0 96,1 88,0 89,8 91,7 94,6
Siembra directa 82,1 89.1 87.3 78.0 91.9 97.4 81.3 78.7 94.9 92.3
Dando por cierto que la diferencia entre los niveles de respiración del suelo de un lote a tomar
al azar bajo labranza convencional y bajo siembra directa es una variable con distribución
Normal,
3. Calcular el valor p para poner a prueba la hipótesis nula que con nivel de significación de
significación = 0,01.
4. Construir e interpretar un intervalo de confianza del 99% para la diferencia de respiración
promedio entre lotes cultivados con soja con labranza convencional y con siembra directa
en el partido de Rojas.
5. ¿El intervalo de confianza del 99% construido es consistente con el resultado de la prueba
de hipótesis? Explicar en qué sentido.
6. ¿Qué tipo de error que se puede haber cometido en esta prueba? ¿Qué significado tendría
en este caso? ¿De qué dependía su probabilidad?
7. ¿A qué población se extiende la inferencia realizada?
4. Explicar a qué nos referimos cuando decimos que los datos presentados constituyen
realizaciones de las variables aleatorias en cuestión.
Suponiendo que estas variables tienen distribución Normal,
5. ¿Cuál es el estadístico de prueba apropiado para poner a prueba estas hipótesis?
6
6. Completar la prueba de hipótesis y concluir en términos del problema de la contaminación
del agua de las napas con nitratos.
7. ¿Qué error se puede haber cometido? ¿Qué significado tiene en relación con la evaluación
de la severidad del problema de contaminación del agua subterránea? ¿Cómo se debió
haber hecho el experimento para poder asegurar razonablemente que el riesgo de este tipo
de error es muy bajo?
𝑏0 = 37,06 hoja/año
mg
𝑏1 = −0,21 (hoja/año)/( )
g
mg
𝑠𝛽̂1 = 0,04(hoja/año)/( )
g
𝑅 2 = 0,57
Ejercicio 12. En la Depresión de Salado (Prov. de Buenos Aires), el agua de los pozos que
se usa para el ganado contiene concentraciones variables de sales. Un técnico planea estimar
el promedio de los contenidos de sales de todos los pozos de dicha región a partir de los datos
de una muestra aleatoria de 25 pozos de la región.
1. ¿En qué consiste el procedimiento que el técnico debe aplicar para obtener la muestra
aleatoria? ¿Qué variables aleatorias registrará?
2. Explicar por qué causas la media muestral de los contenidos de sales del agua de los 25
pozos que se incluyan en la muestra es una variable aleatoria.
7
3. ¿Qué es la esperanza de la media muestral en este caso particular? ¿Qué valor tiene?
4. ¿De qué depende la probabilidad de que la media muestral a obtener tome un valor
cercano al de la media poblacional que se planea estimar?
Si en verdad los contenidos de sales del agua de todos los pozos de la Depresión del Salado
tienen promedio μ = 75 mg /l y desvío estándar σ = 22,8 mg /l,
5. ¿Cuál es el valor aproximado de la probabilidad de que la media muestral que obtendrá el
técnico tome un valor entre 64,8 y 85,2 mg/l?
6. ¿Qué tamaño de muestra debe tomar el técnico para que la probabilidad de que la media
muestral difiera de la media poblacional en menos que 6 mg /l sea a lo sumo de 0,90?
Ejercicio 13. Una empresa agropecuaria evalúa las alternativas de sembrar trigo en dos
localidades A y B. El rendimiento mínimo necesario para obtener un resultado económico
positivo es de 38 quintales/ha. La empresa cuenta con los siguientes datos de rendimiento de
cultivos de trigo escogidos al azar en cada localidad ([quintales/ha]:
Ejercicio 15. Los frutos del curupí (Sapium haemathospermum), un árbol nativo de la
Región Chaco-Pampeana, están divididos en tres compartimentos (lóculos). Cada uno de estos
compartimentos contiene un óvulo que produce una semilla si es fecundado o que aborta si no
es fecundado. En consecuencia, cada fruto de curupí contiene entre 0 y 3 semillas. Un botánico
que investiga la biología reproductiva de esta especie intenta determinar si los insectos
influyen en la polinización de sus flores. Para ello, decide seleccionar dentro de una Reserva
de Vida Silvestre dos muestras aleatorias de 100 flores de curupí y cubrir las flores de la
primera muestra con bolsitas de malla que impiden el acceso de los insectos. Luego de
formados los frutos, los cosechará, los clasificará por el número de semillas que contienen y
registrará las frecuencias de frutos con diferente número de semillas en cada muestra.
8
1. Identificar la población de referencia, las muestras, los tratamientos y las variables
aleatorias involucradas en esta investigación.
2. Formular hipótesis estadísticas apropiadas para decidir con un nivel de significación
α = 0,05 si los datos a obtener permitirán aceptar que los insectos afectan la fecundación
de los óvulos de las flores de curupí.
Una vez completado el experimento, el biólogo cuenta con los datos que se muestran en la
siguiente tabla:
Frecuencias absolutas observadas
Números de semillas 0 1 2 3
Con bolsita 7 24 43 26
Sin bolsita 3 11 51 35
Ejercicio 16. En áreas donde las lluvias no alcanzan para cubrir las necesidades de agua de
los cultivos, se recurre al uso de equipos de riego para completar el suministro de agua para
las plantas. La operación de estos equipos produce costos que, para ser justificados, deben ser
compensados por el valor del incremento de rendimiento que producen. En una localidad
agrícola, se obtuvo un conjunto de datos de los rendimientos de una muestra de cultivos de
soja (quintales/ha) tratados con diferentes intensidades de riego (mm/día) establecidas de
antemano. Con estos datos, se realizó el análisis de regresión lineal simple parte de cuyos
resultados se transcribe a continuación.
1. Explicar qué tipo de relación es razonable proponer que existe entre el rendimiento
[quintales/ha] y la intensidad de riego [mm/día].
9
2. Escribir el modelo de regresión propuesto y explicar cada parámetro en términos de este
problema.
3. Explicar qué son los valores que están en la columna de la tabla de resultados encabezada
con EE.
4. Presentar un intervalo del 95% de confianza para el rendimiento promedio de los cultivos
de soja de esta localidad que no reciben riego.
5. Presentar una estimación puntual del rendimiento promedio de los cultivos de soja de esta
localidad que reciben 30 mm de agua de riego por día.
6. Presentar una estimación puntual del cambio en el rendimiento promedio asociado con un
aumento de 10 mm/día en la intensidad de riego.
7. Explicar por qué las estimaciones presentadas son realizaciones de variables aleatorias.
¿Qué distribución de probabilidad se supone que tiene cada una de esas dos variables
aleatorias?
8. Sobre la base de los resultados del análisis, ¿puede concluirse, con un nivel de
significación α=0,01, que en la localidad en cuestión el rendimiento promedio de los
cultivos de soja aumenta con la intensidad de riego? Justificar la respuesta.
9. ¿Qué tipo de error se puede haber cometido en la respuesta a la pregunta anterior? Explicar
qué consecuencias tendría dicho error. ¿Qué riesgo hemos corrido de cometerlo?
3. Dando por cierto que es razonable suponer que las varianzas de los pesos de los pollos no
difieren entre estos tratamientos, construir un intervalo de confianza 0,99 para la
diferencia entre las medias poblacionales de los aumentos de peso de pollos alimentados
durante 4 semanas con ración habitual y con ración habitual más suplemento dietario (ver
ayuda en ejercicio 6.12).
4. Interpretar el intervalo de confianza construido en términos del interés del productor
avícola.
5. Explicar qué error puede haberse cometido en esta inferencia. ¿Qué nivel de confianza se
puede tener en no haberlo cometido y por qué?
Ejercicio 18. El los prospectos publicados por una compañía productora de semillas se
asegura que, en la Pampa Ondulada, el rendimiento promedio de uno de sus híbridos de maíz
supera las 10 t/ha. Para decidir si se puede aceptar esta afirmación, los productores de un grupo
CREA decide poner a prueba este híbrido cultivándolo en 12 parcelas de 1 ha seleccionadas
al azar en los establecimientos del grupo y registrando los rendimientos a obtener.
1. Identificar la población y las variables aleatorias en cuestión.
10
2. Formular hipótesis verbales y estadísticas apropiadas para la prueba propuesta. Explicar
qué es el parámetro al que se refieren las hipótesis estadísticas.
3. ¿Cuál es el estadístico de prueba apropiado para poner a prueba estas hipótesis? ¿Qué
supuesto implica su uso?
4. Elegir un nivel de significación y explicar qué implica.
5. ¿Cuál es el valor crítico correspondiente al tamaño de muestra y nivel de significación
elegidos?
Una vez cosechadas las parcelas de prueba los rendimientos registrados son los que figuran en
la tabla.
Parcela 1 2 3 4 5 6 7 8 9 10 11 12
Rendimiento (t/ha) 12,4 11,0 10,5 11,7 9,9 12,0 8,9 9,7 11,5 9,2 10,3 11,5
6. Completar la prueba de hipótesis y concluir en términos del objetivo de los productores
del grupo CREA.
7. ¿Qué error se puede haber cometido? ¿Qué consecuencia tendría?
Ejercicio 19. En los últimos años, el hábitat de la fauna pampeana fue modificado porque
gran parte de los pastizales fueron reemplazados por cultivos. Para evaluar la influencia de
dichos cambios sobre la composición de la avifauna, un grupo de ornitólogos decide obtener
una muestra aleatoria de 1000 aves avistadas en el partido de Navarro y clasificarlas según su
hábito alimentario en rapaces, carroñeras, granívoras y otras. El objetivo de los ornitólogos es
determinar si, en el área de estudio, las frecuencias relativas de los grupos mencionados
difieren de los valores históricamente reportados para la avifauna pampeana: rapaces (0,10),
carroñeras (0,13), granívoras (0,58) y otras (0,19).
1. Identificar el tipo de prueba de hipótesis requerido y formular las hipótesis estadísticas
apropiadas para la investigación propuesta.
Una vez obtenida la muestra, entre las 1000 aves avistadas había 115 rapaces, 116 carroñeras,
605 granívoras y 164 de otros hábitos alimentarios.
2. Completar la prueba de hipótesis con un nivel de significación =0,05 y escribir la
conclusión en términos del objetivo de los ornitólogos.
3. Controlar el cumplimiento de los requisitos para la validez de la prueba.
4. ¿Qué representa, en este caso particular, el nivel de significación =0,05 elegido?
11