Estadística Guía TP 2022 Primera Parte

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 26

Estadística

Contenido
Descripción de la materia 2

Trabajo Práctico 1. Estadística descriptiva 4

Trabajo Práctico 2. Probabilidades 11

Trabajo Práctico 3. Distribuciónes de probabilidades. 14

Caso 1. Estrategias de desintoxicación de cadmio en un alga fitoplanctónica 20

2
021

Fecha
[email protected]
2

Descripción de la materia

Docentes responsables

Profesor: Mg. Adriana Pérez [email protected]

Jefe de Trabajos Prácticos: Dr. Héctor Olguín [email protected]

Programa

1. Introducción. Definición. La Estadística y el método científico. La investigación en Biología. La variabilidad


biológica. Error natural y sistemático. Población y muestra. Tipos de muestreo. Estudios observacionales y
experimentales.

2. Estadística descriptiva. Tipos de variables. Distribución de frecuencias. Representaciones gráficas. Medidas


de tendencia central. Medidas de dispersión. Medidas de posición. Medidas de forma. Datos atípicos.

3. Variables aleatorias y distribuciones de probabilidad. Probabilidad. Definiciones. Distribuciones de


probabilidad de variable aleatorias discretas. Distribución binomial. Distribuciones de probabilidad de
variables aleatorias continuas. Distribución normal.

4. Estimación de parámetros. Distribución muestral. Teoría de la estimación. Estimación puntual y por


intervalo. Estimación de promedios y proporciones.

5. Concepto general de las pruebas de hipótesis. Planteamiento de las hipótesis nula y alternativa. Pruebas
uni o bilaterales. Error tipo I y tipo II. Potencia. Conclusiones de una prueba de hipótesis. Nivel de
significación. P de la prueba.

6. Pruebas de hipótesis de una y dos muestras. Prueba para una media o proporción. Pruebas de dos medias:
muestras apareadas y muestras independientes. Prueba de dos varianzas. Prueba de dos proporciones.
Pruebas no paramétricas: Prueba de Wilcoxon. Prueba de los signos. Prueba U de Mann-Whitney. Prueba de
la mediana. Comparación con pruebas paramétricas.

7. Análisis de la varianza. Análisis de la varianza de un factor. Fundamento. Supuestos. Análisis de residuos.


Tabla de ANOVA. Comparaciones múltiples. Pruebas no paramétricas: Prueba de Kruskal-Wallis.

8. Regresión y correlación lineal. Introducción a la regresión lineal simple. Método de los mínimos cuadrados.
Recta de regresión. Introducción a la correlación. Coeficiente de correlación r de Pearson. Pruebas no
paramétricas: Coeficiente de correlación de Spearman y de Kendall. Inferencia sobre regresión y correlación.
Supuestos. Análisis de residuos.

Régimen de aprobación

Aprobación de la cursada:

✔ Se deberán aprobar los dos parciales teórico-prácticos de la materia. La nota mínima para aprobar
cada parcial es 60, que se obtiene al desarrollar correctamente el 60% del mismo.
✔ Se requiere una asistencia mínima del 75%.
✔ Se deberán aprobar trabajos prácticos a requerimiento del docente a cargo.
3

Aprobación de la materia:

Los alumnos que hayan cumplido con los requisitos anteriores tendrán aprobada la cursada y podrán
rendir examen final. Para aprobar el final deberá desarrollarse correctamente el 60% del mismo.

Bibliografía

✔ Balzarini, M., Di Rienzo, J., Tablada, M., Gonzalez, L., Bruno, C., Córdoba, M., ... & Casanoves, F.
(2012). Estadística y Biometría. Ilustraciones del uso de Infostat en problemas de agronomía.
Universidad Nacional de Córdoba.
✔ Milton, J. S. (2001). Estadística para biología y ciencias de la salud (No. QH 323.5. M5418 2001).
✔ Kelmansky, D. M. (2009). Estadística para todos. Buenos Aires: Ministerio de Educación-Instituto
Nacional de Educación Tecnológica.
✔ Baldi, B., & Moore, D. S. 2013. The practice of statistics in the life sciences. Macmillan Higher
Education.
4

Trabajo Práctico 1. Estadística descriptiva


Problema 1: Supóngase que una persona está interesada en conocer cuál es la superficie promedio de los
lotes de una región. Para ello debe seleccionar entre dos métodos, uno donde el experimentador extrae una
muestra de lotes que considere “representativa” o buena a su juicio, y otro donde se extrae una muestra
utilizando un procedimiento objetivo.
Para analizar las consecuencias de la elección de uno u otro método y del tamaño de la muestra, realice el
siguiente experimento:

Método 1: Muestra aplicando su juicio:


a) Mirar durante 10 segundos la hoja con la figura adjunta a este ejercicio y arriesgar una cifra para el
promedio del área de los lotes en la página. La unidad de medida es el cuadrado unitario; por
ejemplo, un rectángulo de 3 filas por 4 columnas de cuadraditos tiene un área de 12. Tal esquema
podría representar un lote de 12 hectáreas. Anotar el resultado de la inspección visual.
b) Obtener las muestras:
Primera muestra: seleccionar 5 lotes, que, a su juicio, sean representativos de los lotes de la región.
Anotar el número de cada uno de los 5 lotes, el cual se encuentra al pie de cada uno de ellos. Anotar
las áreas de cada uno de estos lotes, después calcular el promedio de las 5 áreas.
Segunda muestra: repetir el procedimiento anterior, pero seleccionando 15 lotes. Calcular el
promedio de las 15 áreas.

Método 2: Muestra aleatoria


a) Usando los números de los rectángulos y la tecla RAN# de la calculadora (ej. 100shiftRan==),
seleccionar 5 rectángulos aleatoriamente. Escribir los números y sus correspondientes áreas, y luego
calcular el promedio de estas.
b) Repetir lo realizado en el punto anterior para un conjunto de 15 rectángulos.
c) Calcular el promedio de las 20 áreas de los ítems a) y b).

Hacer los gráficos con los promedios obtenidos por cada uno de los alumnos en los ítems a), b) y c) y
compararlos con los obtenidos en el método 1. Teniendo en cuenta que µ= 7,5 ha, responder las siguientes
preguntas:

1- Muestra aleatoria versus muestra aplicando su juicio: ¿Cuál produce menor sesgo?
2- Dadas las estimaciones con n = 5, n = 15 y n = 20, ¿Cuál es más precisa?
5

Figura 1: Esquema de áreas para el problema 1.

Extraído de Di Rienzo, JA; Casanoves, F; González, LA; Tablada, EM; Díaz, MP; Robledo, CW; Balzarini, MG.
2008. Estadística para las Ciencias Agropecuarias. 7° edición. Ed Brujas, Córdoba.

Problema 2: Se desean realizar distintos estudios relacionados con la producción maderera y capacidad de
forestación de Pinus ponderosa dougl. en la zona centro-sur de la Patagonia argentina. Para los distintos casos
enumerados a continuación, identifique y clasifique las variables estudiadas.

1- las distintas enfermedades fúngicas presentes en plantaciones de Pinus ponderosa dougl de la zona
sur cordillerana.
6

2- La medida de la altura para tres edades distintas, a los 10, 15 y 25 años, siendo 100 ejemplares
observados en cada caso.
3- El número de ejemplares por hectárea que son seleccionados para la producción maderera.
4- La producción anual de madera (m³/año) de dichas plantaciones.
5- El peso en kg de cada ejemplar producido de dichas plantaciones
6- La clasificación por tamaño de distintas especies de pinos existentes (plantas de talla baja, media y
alta).

Problema 3: A continuación, se describen distintos sistemas estudiados. Defina la población, muestra e


individuo para cada uno de ellos. Identifique la variable aleatoria en estudio y clasifíquela.
1- En el estudio de la activación de caminos intracelulares en corteza cerebral de ratas Wistar se
determinó la longitud del axón de las células neuronales luego de aplicar una corriente de 100 pA.
2- En el estudio de cultivos celulares in vitro de la línea N2A se determinó la velocidad de crecimiento
en 20 placas de dichos cultivos.
3- En un estudio realizado sobre el crecimiento del Pez Palo (Percophis brasiliensis) del Atlántico Sur se
observaron 135 ejemplares de dicha especie elegidos al azar en el Golfo San Matías y se determinó el
sexo, largo total, diámetro del otolito y concentración de plomo.
4- Se realizaron estudios a 30 cerdos tomados de diferentes establecimientos de la provincia de Buenos
Aires, elegidos al azar, para determinar la presencia de triquinosis.
5- En un control realizado en campos de la cuenca del río Salado se ha observado un crecimiento en el
número de casos de resistencia parasitaria en bovinos y ovinos. Una muestra aleatoria de 30 rodeos
ovinos mostró que el 60% de los mismos posee resistencia a alguna droga antiparasitaria.

Problema 4: Grafique la siguiente información de la manera que considere más adecuada. Datos en archivos:
TP1.4A549.IDB2, TP1.4diabetes.IDB2, TP1.4tuber.IDB2.
1- Los rendimientos en tubérculos por unidad de superficie indican la superioridad del Tropaeolum
tuberosum sobre la Solanum tuberosum (33,25 y 30,35 t/ha respectivamente) respecto a la Oxalis
tuberosa que presentó el rendimiento más bajo (21,97 t/ha).
2- En un estudio relacionado con la diabetes mellitus se analizó la factibilidad de experimentación con
una mutación de la cepa Wistar de rata (BB), observando que el 40% de los ejemplares desarrolla un
síndrome agudo de hiperglucemia con hipoinsulinemia y cetoacidosis, y otro 30% presenta
intolerancia a la glucosa sin progesión a cetosis. El restante de los individuos raramente desarrolla
síntomas de la diabetes.
3- En un estudio de citotoxicidad sobre la línea células A549, a las que se le internalizaron
nanopartículas magnéticas (NPM) en cuatro concentraciones, se concluyó que la cantidad de células
viables de los cuatro grupos fueron:
● Para el cultivo control (sin internalizar): 2387 células viables, 176 células necróticas y 24 células
apoptóticas.
● Para 10 µg de NPM internalizadas por cultivo: 1398 células viables, 137 necróticas y 87
apoptóticas.
● Para 20 µg de NPM internalizadas por cultivo: 1605 células viables, 240 necróticas y 90
apoptóticas.
● Para 50 µg de NPP internalizadas por cultivo: 1463 células viables, 180 necróticas y 134
apoptóticas.
Ayuda: Aquí las categorías serían el estado de la célula luego del experimento, y habría cuatro
poblaciones distintas.
7

Problema 5: La siguiente tabla de datos representa la cantidad de rizomas presentes en 23 plantas de


caraguatá, luego de tratarlas con un herbicida para evaluar su efecto sobre el crecimiento (TP1.5.IDB2).

1 3 1 2 3 2 8 3 5 1 4 5
4 5 9 5 4 5 6 6 7 8 6

1- ¿Cómo diseñaría este experimento?


2- ¿Cuál es la variable de estudio, su tipo y dominio? Indique la unidad experimental, el tamaño de la
muestra y la población.
3- Elabore una tabla de frecuencias absolutas y frecuencias absolutas acumuladas.
4- Represente gráficamente las frecuencias absolutas simples y acumuladas. ¿Qué forma tiene la
distribución?
5- Calcule la media. ¿Cuál es el valor de la mediana muestral? ¿Qué representan estos valores?
6- ¿Cuál es la cantidad de rizomas más frecuente?
7- Compare los valores de la media, mediana y moda; ¿Qué sugieren con respecto a la forma de la
distribución de esta variable?
8- Calcule la varianza, el desvío estándar y el coeficiente de variación. ¿Son muy variables las plantas
respecto a la cantidad de rizomas?
9- ¿Qué porcentaje de las plantas poseen como máximo 4 rizomas? Y ¿menos de 4?
10- Obtenga el cuartil 1, el percentil 25 y el percentil 75; interprételos.

Problema 6: En la tabla siguiente se presenta la cantidad de mercurio (µg/g de músculo fresco) presente en
una muestra aleatoria de percas extraídas del lago Nahuel Huapi, producto de la contaminación relacionada
con la actividad volcánica. Niveles inferiores a 0,5 µg/g están considerados como valores aptos para el
consumo humano.
1- Usando las definiciones de frecuencia acumulada y relativa, complete los datos faltantes de la tabla.
FA y FR son la frecuencia absoluta y relativa respectivamente, y FAA la frecuencia acumulada.
2- Realice el histograma correspondiente e indique qué tipo de simetría tiene.
3- Estime el porcentaje de peces con niveles de mercurio no aptos para consumo humano.

Intervalo FA FR FAA
0 – 0.1 60 f1 60
0.1 – 0.2 n2 0.4 N2
0.2 – 0.3 30 f3 170
0.3 – 1 n4 0.1 N4
1–2 n5 f5 200

Problema 7: La siguiente información corresponde a pulsaciones cardíacas de 30 personas que participaron


de un programa de entrenamiento (en latidos por minuto:TP1.7.IDB2).
8

5 76 66 56 76 66 60 64 80 60
2
6 84 92 64 66 72 64 66 69 72
4
6 60 78 72 60 64 88 60 64 78
6

1- Grafique y determine la forma de la distribución.


2- Realice una tabla de frecuencias acumuladas y grafique un polígono de frecuencias acumuladas.
3- Obtenga la media aritmética, la varianza y el percentil 25. Interprete.
4- Represente los datos mediante un diagrama de caja e interprete.
5- Antes del entrenamiento los participantes fueron sometidos a la misma prueba. Si sus pulsaciones
fueron, en general, mayores y más variables, ¿qué diferencias esperaría encontrar entre el
histograma de las pulsaciones previas al entrenamiento y el efectuado en el punto 1?

Problema 8: Las distribuciones de frecuencias presentadas en la siguiente figura están realizadas sobre el
mismo número de observaciones.
1- Sin efectuar cálculos, ordénelas en orden creciente según su media, mediana, moda y desvío
estándar.
2- Arme las tablas de frecuencias para cada gráfico. Calcule la media, mediana, moda y desvío estándar.
Recuerde que para datos agrupados, la distribución de datos dentro de cada clase se supone
uniforme.
9

Problema 9: En un vivero experimental se siembran semillas de una especie de araucaria en bandejas con sólo
seis lugares (una semilla por lugar). Al cabo de un tiempo se toma una muestra aleatoria de 50 bandejas y se
cuenta la cantidad de semillas germinadas por bandeja con los siguientes resultados (TP1.9.IDB2):

1 2 6 4 0 3 4 3 3 6
2 3 4 3 5 0 1 3 3 3
5 2 6 1 6 1 3 4 5 3
5 4 3 4 2 2 0 2 3 4
5 2 1 2 3 3 3 4 5 4

1- Indique la unidad experimental, la variable, la población, la muestra, y la población estadística. ¿De


qué tipo de variable se trata?
2- Agrupe los datos en una tabla de frecuencias. ¿En qué porcentaje de bandejas germinaron a lo sumo
2 semillas? ¿Y en qué porcentaje germinó alguna semilla?
3- Grafique los datos mediante un diagrama de frecuencias relativas y un polígono de frecuencias
acumuladas.
4- Obtener los estadísticos de tendencia central y de variabilidad.
5- Obtener el rango de las medidas, realizar un diagrama de caja e interpretar.
6- Calcular el percentil 30. ¿Qué información provee este percentil?

Problema 10: En el siguiente conjunto de datos se proporciona el tiempo de desarrollo hasta su madurez de
una variedad de papa (cultivada en la puna de los andes centrales y meridionales), indicado en días después
de la siembra (DDS). La medición del nivel de desarrollo viene dada por la cantidad de fitomasa producido por
una planta, alcanzando su madurez cuando no existe aumento de fitomasa (TP1.10.IDB2).

179 173 169 172 171 169 168 181 174 173 177 179 178 176 178 175
165 175 167 175 174 176 174 174 172 177 175 176 176 167 176 177
183 164 181 175 173 178 173 178 175 176 173 171 174 175 174 175
17 178 175 176 174 178 179 180
3

1- Construir una tabla de frecuencias relativas y absolutas de estos tiempos.


2- Hallar las frecuencias relativas acumuladas.
3- Calcular la mediana y la moda.
10

4- Realizar un diagrama para las frecuencias relativas acumuladas. ¿Qué fracción madura antes de los
175 DDS?
5- Encuentre cuántos días tarda en alcanzar la madurez el 25%, 50% y 75% de la población.
6- Utilice el rango y los valores hallados en el item anterior para realizar un diagrama de caja.

Problema 11:
La frutilla es una de las frutas más perecederas, susceptible a daño mecánico, deterioro fisiológico, ataque por
hongos, etc. Por otro lado, gran parte de la fruta se congela y es necesario evaluar el efecto de este proceso
sobre la calidad de la fruta. Se desea comparar la resistencia al congelamiento de la variedad Camarosa con la
de la variedad Sweet Charly. Para ello, en muestras de 100 g de frutillas de cada variedad congeladas a –20°C
durante de 3 meses, se midió el volumen de líquido perdido luego del descongelamiento. Este es un
parámetro importante en el procesamiento industrial no solo porque permite evaluar la calidad del proceso
de congelado-descongelado sino que además permite estudiar la pérdida de resistencia mecánica en el
cambio de estado. Los resultados fueron (en ml/100 g de fruta) (TP1.11IDB2):

10,96 8,15 10,69 12,46 9,71 10,99


9,78 11,5 9,19 10,27 13 9,84
5
10,51 9,84 10,03 8,85 11,9 10,69
1
7,57 8,49 10,22 12,69 11,0 8,85
4
11,68 11,6 12,24 13,04 6,75 10,24
2
11,58 11,5 9,63 11,75 9,99 7,95
2
10,03 9,36 10,53 10,95
Camarosa Sweet Charly
20,04 21,5 22,13 20,76 19,0 21,65
6 9
19,8 19,6 24,38 22,62 22,3 21,24
1 4
18,84 17,6 19,45 23,12 21,4 16,57
1 7
18,37 17,7 20,42 15,71 19,7 17,6
8 2
21,91 21,1 20,82 22,68 19,8 17,06
1 4
20,42 21,9 18,86 19,78 16,8 21,78
1 7
15,38 20,0 19,73 19,34
7

Para ambos conjuntos de datos:


1- Definir y clasificar la variable, identificar la unidad experimental, muestra y población.
2- Construir la distribución de frecuencias considerando 6 intervalos. Graficar mediante un histograma.
11

3- Construir el polígono de frecuencias acumuladas relativas. Ubicar gráficamente a la mediana.


4- Calcular la media, la mediana, la moda, el desvío estándar y el coeficiente de variación.
5- Calcular el percentil 75 e interpretar el resultado.
6- Utilizando los gráficos y estadísticos obtenidos comparar ambos conjuntos de datos, ¿para qué
variedad se obtiene un mejor proceso de congelado? ¿Cuál presenta mayor variabilidad?

Problema 12: Los datos de la tabla corresponden al salario mensual de un grupo de 50 obreros de la industria
textil, a mediados del 2009 (TP1.12.IDB2):
2530 2230 2310 2320 2810 2340 2310 2420 2340 1960
2460 2780 2350 2520 2780 2380 2520 2460 2370 2510
2920 2380 2370 2420 2380 2970 2200 2260 2170 2360
6310 2440 2980 2370 2180 2250 2390 2360 2440 2400
2450 2380 2410 2480 2330 2450 2740 7100 2370 1980

1- Calcular las medidas de tendencia central. ¿Cuál de las tres medidas es la menos representativa de
los datos? ¿Por qué?
2- Calcular el desvío estándar y la varianza.
3- Calcule el primer y tercer cuartil. Interprete el intervalo [Q1; Q3].
4- Calcule el salario promedio mensual de los trabajadores suponiendo un aumento de $300 en el
sueldo de cada uno de ellos.
5- Si un grupo de 50 obreros chilenos de la industria textil tiene un sueldo mensual promedio de
$311000 y un desvío típico de $41000, ¿cuál de los dos grupos es más homogéneo? ¿Por qué?
6- Realice una tabla de frecuencias, agrupando los datos en intervalos de manera adecuada.
7- Para los datos agrupados, calcular la media, mediana y moda. ¿Por qué se obtienen distintos valores
que los calculados en 1?
8- Grafique un histograma para los datos agrupados y comente la forma de la distribución.

Problema 13: Se determinó mediante un nuevo método la concentración de fosfolípidos en 36 alícuotas de


aceite crudo de girasol (de 10 ml cada una), extraídas de un lote. Los resultados (en g/100g) fueron
(TP1.13.IDB2):

0,2 0,35 0,29 0,28


0,39 0,23 0,18 0,15
0,45 0,42 0,38 0,21
0,26 0,27 0,17 0,31
0,1 0,25 0,26 0,3
0,44 0,35 0,28 0,29
0,24 0,28 0,3 0,27
0,38 0,37 0,29 0,32
0,16 0,24 0,22 0,28

1- Identifique y clasifique la variable, la unidad de observación, la muestra y la población en estudio.


12

2- Grafique los datos. ¿Identifica algún dato atípico? ¿Qué tipo de simetría tiene la distribución?
3- Calcule el promedio y el desvío estándar.
4- Calcule la mediana de la concentración de fosfolípidos.
5- La presencia de fosfolípidos causa siempre inconvenientes y pérdidas en las distintas etapas de
refinación del aceite, ya que favorece la formación de emulsiones. Los aceites con contenidos
superiores a 0,40 g/100 g son considerados de calidad inferior. ¿Qué porcentaje representan estas
muestras?
6- Calcule el percentil 10 e interprete el valor obtenido.
7- El método tradicional para la determinación de fosfolípidos aplicado sobre las mismas 36 muestras,
arrojó un promedio de 0,25 g/100 g con una varianza de 0,01 (g/100 g) 2. ¿Cuál de los dos métodos
considera más preciso?

Problema 14: Creando histogramas sin datos. Para las siguientes variables, determine qué forma de la
distribución esperaría y explique brevemente por qué:
1- tiempo en completar un examen difícil (el tiempo máximo es de 2 horas)
2- las notas de un examen fácil
3- edad de la población de la Ciudad de Buenos Aires en 2010 (según los resultados del Censo Nacional,
el 50% tenía a lo sumo 36,8 años)
4- edad de la población de Misiones en 2010 (según los resultados del Censo Nacional, el 50% tenía a lo
sumo 23,9 años)
5- contenido neto de azúcar en paquetes de 1 kg
6- edad en el momento de la defunción para la Argentina en 2012
7- ingresos mensuales de los jugadores de fútbol profesionales
13

Trabajo Práctico 2. Probabilidades


Problema 1: Para realizar una experimentación sobre diabetes, se tienen 25 hamsters de dos especies en una
jaula: 10 de Mesocricetus auratus y 15 de Cricetulus griseus. Sea el experimento que consiste en extraer al azar
dos hamsters de dicha jaula. Suponiendo que los experimentos se realizan (a) con reposición; (b) sin reposición,
1- Describa el espacio muestral y asigne probabilidades a cada uno de los elementos del espacio
muestral.
2- Calcule, para cada tipo de extracción, la probabilidad de que los dos hamsters extraídos sean de la
misma especie.
3- Calcule, para cada tipo de extracción, la probabilidad de que el primer animal extraído sea
Mesocricetus auratus.

Problema 2: Se tienen dos contenedores (A y B) con langostas Rhammatocerus schistocercoides en dos formas,
solitarias y gregarias, para el estudio del control biológico de la plaga mediante el hongo Metarhizium
anisopliae. En el contenedor A el 30% de las langostas son gregarias y en el B lo son el 20%. Si se extrae una
langosta de cada frasco, calcular la probabilidad de que sean:
1. Una gregaria y una solitaria
2. Ambas gregarias
3. La del frasco A gregaria y la del B, solitaria

Problema 3: En un laboratorio de comportamiento hay dos peceras conteniendo 5 y 10 ejemplares


respectivamente de carpa dorada (Carassius auratus). Aunque el investigador no lo sabe, un ejemplar de la
primera pecera y tres de la segunda están parasitados por el copépodo Ergasilus sp. El investigador elige un
ejemplar cualquiera para una experiencia.
1. ¿Cuál es la probabilidad de que haya elegido uno de los parasitados?
2. Si el ejemplar elegido fue uno de los parasitados por Ergasilus sp, ¿cuál es la probabilidad de que haya sido
sacado de la primera pecera?

Problema 4: En un estudio sobre el efecto de las radiaciones ionizantes sobre D. melanogaster se obtuvieron 40
ejemplares de los cuales 5 presentaban una mutación. Si se extraen dos individuos al azar, calcular las
siguientes probabilidades suponiendo (a) extracción con reposición, (b) extracción sin reposición:
1- los dos presenten la mutación.
2- Uno solo presente la mutación.
3- Sólo el primero presente la mutación.
4- Alguno presente la mutación.

Problema 5: La determinación del grupo sanguíneo es relevante, entre otras cuestiones, para prevenir
reacciones inmunes frente a transfusiones o trasplantes y en la enfermedad hemolítica del recién nacido. Las
dos clasificaciones más importantes para describir grupos sanguíneos en humanos son el sistema AB0 y el factor
Rh. El sistema ABO se basa en la presencia de antígenos en la superficie de los glóbulos rojos o eritrocitos,
quedando definidos cuatro grupos:
● Grupo A: sus glóbulos rojos expresan
antígenos de tipo A en su superficie y
anticuerpos contra los antígenos B en el
plasma.
● Grupo B: sus glóbulos rojos con antígenos
de tipo B en su superficie y anticuerpos
contra los antígenos A en el plasma.
● Grupo AB: teniendo ambos antígenos en la
superficie de sus glóbulos rojos, no
fabrican anticuerpos contra ningún
antígeno
14

● Grupo 0: no tienen dichos antígenos (A o B)


en la superficie de sus glóbulos rojos, pero
tienen anticuerpos contra ambos tipos.

Según un estudio efectuado en 2001, los cuatro grupos sanguíneos se reparten en la población argentina de la
siguiente manera: Grupo 0 = 54%, A = 34%, B = 9%, AB = 3%.
Suponga que se eligen dos personas de nacionalidad argentina al azar. Calcule la probabilidad de que:
1- Las dos pertenezcan al grupo 0.
2- Una sea del grupo A y la otra del B.
3- Las dos pertenezcan al mismo grupo sanguíneo.
4- Si se necesitan dadores del grupo A. ¿Cuál es la probabilidad de que ninguna de estas dos personas
pueda ser donante? (solo pueden ser donantes personas del grupo A o 0)

Por otro lado, el sistema Rh se basa en otro grupo


de antígenos que se denominaron factores Rhesus
(factores Rh), porque fueron descubiertos durante
unos experimentos con monos Rhesus. Las
personas con factores Rhesus en su sangre se
clasifican como Rh positivas, mientras que
aquellas sin los factores se clasifican como Rh
negativas. Los donantes de sangre y los receptores
deben tener grupos compatibles. El grupo 0- es
compatible con todos, por lo que quien tiene
dicho grupo se dice que es un donante universal,
aunque solo puede recibir sangre de un donante
0-. Por otro lado, una persona cuyo grupo sea AB+,
podrá recibir sangre de cualquier grupo, y se dice
que es un receptor universal. La compatibilidad
entre grupos se muestra en la tabla de la derecha.

En un estudio efectuado el año pasado se determinó la frecuencia de los grupos sanguíneos y factor Rh de
todos los donantes de bancos de sangre de hospitales públicos de CABA. Los resultados fueron:

Grupo \ Factor Rh+ Rh-


0 1085 129
A 680 73
B 175 24
AB 54 8

5- ¿Qué variables se analizaron? ¿De qué tipo son?


6- ¿Se trata de una muestra o de la población? ¿Cuántos donantes la componen?
7- ¿Cuál es el grupo sanguíneo más frecuente? ¿Cuál es el factor Rh más frecuente? ¿Y cuál la
combinación más frecuente?
8- Construya una tabla que contenga los porcentajes de cada grupo y factor y realice un gráfico adecuado
para representarlos.
9- Si se seleccionase al azar uno de estos donantes, calcule la probabilidad de que:
a. Sea Grupo 0
b. Sea Factor Rh+
c. Sea donante universal
d. Sea receptor universal
e. Sea Grupo 0 sabiendo que es Rh+
f. Sea Grupo 0 sabiendo que es Rh-
15

g. Pueda ser donante de una persona B+

Problema 6: La tasa de preñez identifica la proporción de hembras que resultan preñadas en cada ciclo y es
considerada un importante indicador de la eficiencia reproductiva. Para evaluar estrategias que permitan
mejorar la eficiencia reproductiva de las ovejas Merino se implementa un ensayo en el campo experimental
Pilcaniyeu, Río Negro. Se comparan tres tratamientos: I) 70 hembras sin tratamiento hormonal, II) 40
hembras con sincronización hormonal de estros, III) 40 hembras con sincronización hormonal de estros y
estimulación hormonal con gonadotropina. Cuarenta y nueve ovejas resultaron preñadas en el primer grupo,
32 en el segundo y 35 en el tercero. Definamos ahora el experimento aleatorio que consiste en elegir al azar
una de las 150 hembras y registrar si estaba preñada o no y qué tratamiento recibió.
1- ¿Cuál es el espacio muestral de este experimento aleatorio?
2- Indique dos eventos compatibles y dos incompatibles del mismo.
3- ¿Cuál es la probabilidad de que la hembra esté preñada?
4- ¿Cuál es la probabilidad de que la hembra esté preñada y no haya recibido tratamiento hormonal?
5- De las hembras preñadas, ¿qué porcentaje no fueron tratadas?
6- Calcule la tasa de preñez para cada tratamiento y compare. ¿Cuál parece ser más efectivo?

Problema 7: En una localidad dedicada a la producción de cítricos se sabe que las tres cuartas partes de los
lotes comerciales se dedica a la producción de naranjas, mientras que el resto a la de mandarinas. Por otro
lado, se calcula que el 10% de los lotes de naranjas y el 5% de los de mandarinas se encuentran atacados por
la mancha negra de los cítricos, una enfermedad fúngica que disminuye la cantidad y calidad de los frutos y
que impide el ingreso al mercado de fruta fresca internacional.
1- ¿Cuál es la probabilidad de que un lote tomado al azar no pueda exportar su producción debido a la
presencia de mancha negra?
2- ¿Cuál es la probabilidad de que un lote tomado al azar se dedique a la producción de naranjas y no
esté atacado por la mancha negra de los cítricos?
3- De los lotes afectados por la mancha negra de los cítricos, ¿qué porcentaje cultiva mandarinas?
4- ¿Son independientes el tipo de cultivo y la presencia de mancha negra en un lote tomado al azar?
Fundamente su respuesta.

Problema 8: El cobre es un elemento traza esencial que interviene en múltiples procesos metabólicos, pero
que causa efectos tóxicos cuando su concentración supera la que los organismos son capaces de regular. Si
bien en ecosistemas acuáticos el cobre suele encontrarse en concentraciones muy bajas, podría causar
toxicidad en los organismos acuáticos más sensibles. El objetivo del siguiente trabajo fue comparar e informar
la toxicidad del cobre sobre Rhinella arenarum (sapo común sudamericano) en diferentes etapas de su ciclo
de vida. A tal fin, se realizaron bioensayos exponiendo organismos de distintos estadios a una concentración
de 50 µg Cu2+/L durante 168 horas. De 40 embriones expuestos se encontró que solo 16 sobrevivieron; de 30
larvas, sobrevivieron 21, mientras que, de 20 juveniles expuestos, sobrevivieron 16. Si se elige al azar un
individuo de este experimento (responda en el siguiente documento compartido):
https://docs.google.com/document/d/1Ro2czctpSoUu3Qm7hsdah7w1-gvv-ASFtlwf-AKUVxQ/edit?usp=sharing

A) Si se elige al azar un individuo de este experimento:

1. Enumere los elementos que componen el espacio muestral.


2. ¿Cuál es la probabilidad de que se trate de un juvenil vivo? ¿Se trata de una probabilidad conjunta,
marginal o condicional?
3. ¿Cuál es la probabilidad de que haya sobrevivido si se trata de un embrión? ¿Se trata de una
probabilidad conjunta, marginal o condicional?
4. La mortalidad de Rhinella arenarum por la exposición a cobre ¿es estadísticamente independiente de
la etapa del ciclo de vida en que es expuesto? Justifique su respuesta. Si la respuesta es negativa,
indique cuál etapa es más susceptible, fundamentando.
B)
5. ¿Cuánto vale la probabilidad de que entre dos individuos de este experimento elegidos al azar solo
uno sobreviva?
16

C) Construya una tabla de contingencia y un diagrama de árbol

Problema 9: Un test de diagnóstico tiene una probabilidad 0,9 de detectar la presencia de Escherichia coli, en
caso de haberla (sensibilidad del test). Si no está presente, detecta su ausencia con una probabilidad de 0,8
(especificidad del test). La probabilidad de que una muestra de agua contenga Escherichia coli es 0,20
(prevalencia) (las aclaraciones entre paréntesis corresponden a la terminología utilizada en Epidemiología).
1- ¿Cuál es la probabilidad de que el test de un resultado positivo?
2- ¿Cuál será la proporción de resultados positivos en muestras de agua contaminadas con esta bacteria?
3- ¿Cuál es la proporción de resultados negativos en muestras de agua pura?
4- ¿Qué indican estas proporciones con respecto al total? ¿Es correcto que sus valores sean altos? ¿Por
qué?
5- Suponiendo que el test dio un resultado positivo, ¿cuál es la probabilidad de que realmente la muestra
de agua contenga E. coli? (Valor predictivo positivo del test)
6- Por otro lado, si el test da un resultado negativo, ¿cuál es la probabilidad de que realmente el agua
está libre de bacterias? (Valor predictivo negativo del test)
7- Calcular el coeficiente Falso – positivo = P(test positivo cuando la bacteria está ausente)
8- Calcular el coeficiente Falso – negativo = P(test negativo cuando la bacteria sí está presente)
17

Trabajo Práctico 3. Distribuciones de probabilidad


Problema 1: En un vivero dedicado al cultivo de clavel se registró la cantidad de varas florales por planta
obtenidas la última temporada, en cada una de las 2000 plantas con las que cuenta. Los valores resultantes del
conteo fueron los siguientes:

Nro. de varas FA P
73
1 80
2 117
3 154
4 283
5 407
6 511
7 280
8 95

1. Construya la distribución de probabilidades para la variable discreta X = número de flores presentes


por planta de clavel.
2. ¿Cuáles la probabilidad de que una planta seleccionada aleatoriamente presente tres flores?
3. ¿Cuál es la probabilidad de que una planta seleccionada aleatoriamente presente cuatro flores o más?
4. ¿Cuál es el valor esperado de X si se toma una planta aleatoriamente? ¿Y su varianza?

Problema 2: Sea el experimento aleatorio que consiste en arrojar un dado dos veces, y contar cuántas veces
sale un as.
1- ¿Cuál es la variable aleatoria?
2- ¿Cuál es el dominio de esta variable?
3- Describa el espacio muestral y asigne probabilidades para cada evento.
4- Encuentre el valor esperado y la varianza de la variable aleatoria.

Problema 3: En una región de experimentación de la laguna de Chascomús se pretende estudiar la incidencia de


los cambios climáticos sobre la población ictícola de la laguna. Para esto se confinaron 50 ejemplares de
pejerrey y 70 ejemplares de bagarito en un acuario, sobre los que se realizarán distintos ensayos. Para esto, se
toman 3 peces al azar de dicho acuario, y se los coloca en una pecera de experimentación. Sea X=número de
pejerreyes y bagaritos presentes en la muestra de 3 ejemplares.
1- Describa el espacio muestral de la V.A. X.
2- ¿Cuál es la probabilidad de que los 3 peces sean bagaritos?
3- ¿Cuál es la probabilidad de que en la muestra haya un bagarito y dos pejerreyes?
4- Realice los mismos cálculos suponiendo una distribución binomial y compare con los obtenidos en los
incisos 1, 2 y 3.
18

Problema 4: En un estudio de enfermedades en ciervo colorado (Cervuselaphus l.) de la región pampeana se


analizó el contenido de la secreción seromucosa de los animales para relevar la presencia de Dictyocaulus
noerneri, un parásito que se aloja en los pulmones del ganado. Para ello se toman periódicamente muestras
aleatorias de 10 ciervos y se observan sus secreciones seromucosas. Si a partir de estudios previos en la región
se cree que el 12% de los animales estaría infestado,
1- Identifique la variable aleatoria, su dominio o campo de variación y los parámetros de su distribución
de probabilidades. ¿Qué tipo de simetría presenta la distribución?
2- Calcule la probabilidad de que en al menos tres de los animales de la muestra se encuentre dicho
parásito.
3- Calcule la probabilidad de que a lo sumo dos no contengan Dictyocaulus noerneri.
4- Calcule la cantidad esperada de animales con Dictyocaulus noerneri y su varianza.
5- Si en un muestreo se obtienen 8 ejemplares infectados, ¿dudaría de la validez de los estudios previos?
Justifique su respuesta.

Problema 5: Para estudiar la regulación hormonal de una línea metabólica se inyectan ratas albinas con un
fármaco que inhibe la síntesis de proteínas del organismo. En general, 4 de cada 20 ratas mueren a causa del
fármaco antes de que el experimento haya concluido. Si se trata a 10 animales con el fármaco,
1- Identifique la variable aleatoria, su dominio o campo de variación y los parámetros de su distribución
de probabilidades. ¿Qué tipo de simetría presenta la distribución? ¿Cuál es su esperanza y su
coeficiente de variación?
2- ¿Cuál es la probabilidad de que al menos 8 lleguen vivas al final del experimento?
3- ¿Cuál es la probabilidad de que al finalizar el experimento hayan muerto sólo 3 ratas? ¿Es un suceso
raro?

Problema 6: La capacidad de los embriones bovinos obtenidos por fertilización in vitro para ser viables y
culminar en terneros vivos es muy importante a nivel de la producción comercial. Un método de congelación-
descongelación de embriones asegura una viabilidad (definida como la probabilidad de que el embrión se
desarrolle adecuadamente) del 25%. Supóngase que se toman 10 embriones bovinos sometidos a dicha técnica
y se registra el evento “viable” o “no viable” después de 5 días desde su descongelamiento. En este
experimento los embriones fueron cultivados individualmente de manera de asegurar respuestas
independientes.
1- Halle la probabilidad que sean viables 7 de los 10 embriones.
2- Halle la probabilidad que sean viables al menos 3 de los 10 embriones.
3- Halle la probabilidad que sean inviables a lo sumo 5 embriones.
4- ¿Es imposible que todos sean viables? Fundamente su respuesta.
5- ¿Cuál debería ser la viabilidad del método de congelación para que la probabilidad de que sobrevivan
todos los embriones sea de por lo menos 80%?
6- Halle la esperanza de esta variable aleatoria y la varianza. ¿Cambian ambos parámetros si cambia el
suceso que considera “éxito”?

Problema 7: Suponga que la probabilidad de que un embrión de Rhinella arenarum sobreviva, calculada en el
problema 7 del TP2, es una buena aproximación a las probabilidades que tienen los embriones de Rhinella
arenarum de sobrevivir en ambientes acuáticos naturales con esa concentración de cobre. En una muestra
aleatoria de 10 embriones de la laguna Chis-Chis expuestos a dicha concentración de cobre,
1. ¿Cuál es la probabilidad de que mueran exactamente 6 embriones? Indique cuál es la variable
aleatoria en estudio, su dominio y su esperanza.
2. ¿Cuál es la probabilidad de que sobrevivan como mínimo 2 embriones? ¿Es un suceso raro?

Problema 8: De una estación parte un tren cada 20 minutos. Un viajero llega de improviso, sin conocer los
horarios de los trenes. Halle:
1- La función de distribución de la variable aleatoria “tiempo de espera”.
19

2- La probabilidad de que espere al tren menos de 7 minutos.


3- La esperanza y varianza de la variable aleatoria.
4- La probabilidad de que espere exactamente 12 minutos.

Problema 9: El tiempo de vida (en minutos) de cierto virus, es una variable aleatoria con función de densidad

−x
1
f ( x )={ e 1000 si x >0 0 en elresto
1000

1- ¿Cuál es la probabilidad de que el tiempo de vida sea superior a 100 minutos?


2- ¿Cuál es la probabilidad de que viva entre 100 y 500 minutos? De ellos, ¿qué proporción vivirá menos
de 300 minutos?

Problema10: La función distribución de probabilidad de un evento X está descrita por

x 1 x
F ( x )={0 si x< 0 si0< x ≤ 1 si1 ≤ x <2 si 2 ≤ x <4 1 si 4 ≤ x
2 2 4

1- Determinar la probabilidad de que x> 2


2- Hallar P(1<x<2)
3- Determine la función de densidad de probabilidad
4- Determine E(x)

Problema 11: Entre los diabéticos, el nivel de glucosa en sangre en ayunas ( X) puede suponerse de distribución
aproximadamente normal, con media 106 mg/100 ml y desviación estándar de 8 mg/100 ml, es decir
2
X → N (µ=106 , σ =64)

1- Halle P ( x ≤ 120 ) e interprete. Calcule e interprete el valor de Z.


2- ¿Qué porcentaje de los diabéticos tiene los niveles de glucosa comprendidos entre 90 y 120 mg/100
ml?
3- Halle el nivel de glucosa en ayunas correspondiente al percentil 25. ¿Qué significado tiene este valor?
4- Grafique la distribución de probabilidades utilizada, rotulando claramente los ejes. Identifique en el
gráfico la probabilidad obtenida en el ítem 1 y el percentil 25.

Problema 12: Se sabe que la anchura del tórax X, medida en mm, de una población de coleópteros sigue una
distribución normal con media en 9,86 mm y desviación estándar de 2,89 mm.
1- ¿Cuál es la probabilidad de obtener un coleóptero con una anchura menor a 8,3 mm? Calcule e
interprete el valor de Z.
2- ¿Cuál es la probabilidad de que un ejemplar mida entre 9,89 y 12,75 mm?
3- De los ejemplares que miden menos de 8,3 mm, ¿qué porcentaje mide más de 8 mm ?
4- En una muestra aleatoria de 30 ejemplares, ¿cuántos espera que midan más de 12,75 mm?
Si se necesitan para un estudio 20 coleópteros que superen los 9,89 mm de anchura,
5- ¿Cuál es la probabilidad de que una muestra de 30 ejemplares tomados al azar cumpla con dicho
requerimiento?
6- ¿Cuál es el valor esperado de coleópteros que cumplan con la condición?

Problema 13: En sistemas pastoriles como los argentinos, la producción de forraje de un establecimiento
ganadero es una variable clave porque representa la principal fuente de alimento para el ganado. En la zona
de la Depresión del Salado (Pcia de Buenos Aires), la producción forrajera anual de un establecimiento
tomado al azar es una variable aleatoria con distribución aproximadamente Normal con media 4,60 tn/há y
desvío estándar de 0,70 tn/há. En los establecimientos de una región cercana (la Depresión de Laprida), la
20

producción forrajera anual de un establecimiento tomado en forma aleatoria, se distribuye normalmente con
media de 5,92 tn/há y varianza de 0,81 (tn/há)2.
1. Grafique ambas distribuciones rotulando los ejes y compárelas.
2. Calcule la probabilidad de que la producción forrajera de un establecimiento tomado al azar en la
Depresión del Salado sea menor de 5 tn/ha y compárela con la probabilidad de que la producción forrajera
de un establecimiento tomado al azar en la Depresión de Laprida sea no mayor de 4,8 tn/ha. ¿Cuál es el
evento con mayor probabilidad?
3. Considere la producción forrajera media anual y su variabilidad. ¿En qué región aconsejaría Usted adquirir
un establecimiento ganadero? Explique brevemente.
4. Si la Intendencia de Laprida decide no destinar a la producción forrajera el 20 % de los lotes con menor
producción anual. ¿Cuál es la producción anual máxima de los lotes descartados?
5. En la Depresión del Salado, ¿cuál sería el valor de la probabilidad de que 2 entre 10 establecimientos
tomados al azar tuvieran una producción forrajera media anual mayor a 5 tn/ha? ¿Cuál es la variable
aleatoria en estudio en este caso, su dominio y su distribución de probabilidades?

Problema 15: La República Argentina es el octavo productor mundial de cítricos y primer productor mundial
de limón.  Las naranjas deben pertenecer a la categoría comercial “extra” para ser destinadas a los mercados
externos. Para que una naranja de la variedad Valencia late sea considerada categoría “extra” su diámetro
debe encontrarse entre 90 y 100 mm y no debe tener defectos, salvo defectos superficiales muy leves.
En la zona de Concordia se sabe que el diámetro medio de las naranjas de dicha variedad en condiciones
climáticas normales es de 93 mm con un coeficiente de variación del 13% y distribución aproximadamente
normal.
1- Determine qué porcentaje de frutos esperaría que se encuentren dentro del diámetro requerido para
exportación.
2- Determine el diámetro del fruto superado por el 90% de los frutos. ¿Como se denomina este
estadístico?
3- En una muestra de 20 frutos elegidos al azar, ¿cuál es la probabilidad de que a lo sumo dos posean el
diámetro requerido para exportación? Indique cuál es la variable en estudio, dominio y parámetros.
4- Por otro lado, se estima que sólo el 15% de los frutos no presenta defectos o presenta defectos
superficiales leves. Si el diámetro y la presencia de defectos en los frutos fuesen independientes,
¿cuál sería la probabilidad de que un fruto NO pertenezca a la categoría “extra”?

Problema 17: Por medio de un tamiz de malla de 8 mm de diámetro se zarandean 8000 granos de maíz. El
diámetro del grano de maíz sigue una distribución normal con esperanza igual a 9 mm y una desviación
estándar de 1.2 mm.
1- ¿Qué proporción de granos serán retenidos por el tamiz?
2- ¿Qué proporción de granos no retenidos por el tamiz de 8 mm serán retenidos por un tamiz de
diámetro de malla igual a 7.5 mm?
3- ¿Qué proporción de granos pasará a través de los dos tamices?

Problema 18: Un fitomejorador desea controlar la variabilidad de los brotes comerciales de espárrago, ya que
las normas de embalaje establecen una longitud máxima de cajas de 23.5 cm. Suponiendo que la longitud de los
brotes de este cultivo se distribuye normalmente con una esperanza igual a 21 cm ¿cuál debería ser el valor de
la desviación estándar del carácter longitud del brote, para que la probabilidad de que existan espárragos que
no puedan ser embalados, no sea mayor a 0.05?

Problema 19: Teorema Central del límite. Simulación. Drosophila buzzatti es un díptero que se encuentra en
el noroeste argentino y que se cría principalmente en cactus en descomposición. Un laboratorio de
investigación utiliza esta especie como modelo para el estudio de adaptaciones evolutivas. En una caja
experimental hay 100 ejemplares adultos de esta especie. El largo del ala (en mm) de cada ejemplar se
encuentra en el archivo tp3.19 largo ala.IDB2:
21

Id Largo Id Largo Id Largo Id Largo Id Largo Id Largo Id Largo


1 103,7 16 99,8 31 91,2 46 80,4 61 109,6 76 74,5 91 70,6
2 77,7 17 95,2 32 89,8 47 88,5 62 87,9 77 98,4 92 104,0
3 88,8 18 98,7 33 104,9 48 93,7 63 91,7 78 50,0 93 116,3
4 86,7 19 91,3 34 98,7 49 95,8 64 78,4 79 85,6 94 88,6
5 71,8 20 108,4 35 95,8 50 88,8 65 95,2 80 88,5 95 83,3
6 87,7 21 94,2 36 108,0 51 113,7 66 89,5 81 98,8 96 88,6
7 65,8 22 89,7 37 93,6 52 72,2 67 82,9 82 52,7 97 80,0
8 88,1 23 99,6 38 89,2 53 107,4 68 102,7 83 91,7 98 71,0
9 109,3 24 84,6 39 62,1 54 102,6 69 114,2 84 85,3 99 95,7
10 68,7 25 101,5 40 88,2 55 99,7 70 72,1 85 76,7 100 108,3
11 87,0 26 78,4 41 76,0 56 53,9 71 104,4 86 108,6
12 81,0 27 96,6 42 95,4 57 79,3 72 95,6 87 87,7
13 103,0 28 105,3 43 107,9 58 113,8 73 87,9 88 88,2
14 103,5 29 98,3 44 107,7 59 108,6 74 93,0 89 71,7
15 101,0 30 79,9 45 82,1 60 103,7 75 88,5 90 65,7

El largo promedio de todos los ejemplares es …………………….. con un desvío estándar de……………….. y la forma de
la distribución es…………………………………….
Suponga que Ud. desconoce esta información y desea estimar el largo promedio de los ejemplares de la caja.
Para ello decide extraer una muestra aleatoria de 5 ejemplares. Extraiga la muestra (puede utilizar la tecla
RAN# de la calculadora) y calcule el promedio y el desvío estándar en su muestra.
El promedio obtenido en base a los 100 datos es un .........................., habitualmente es desconocido y en un
momento dado toma ................ valor/es, por lo tanto se comporta como una...................................; en este
caso vale ......................
El promedio obtenido en base a los 5 datos es un ........................, habitualmente es con la única información
con que se cuenta y puede tomar ................. valores, por lo tanto se comporta como una…………………..............;
para esta muestra vale .......................
La diferencia entre el estimador muestral y el parámetro poblacional se conoce como error muestral y se debe
al azar. Para esta muestra vale: ......................
La cantidad total de muestras de 5 moscas que puede extraerse de la caja es ……………………
Si calculase la media de cada una de las posibles muestras podría conocer la distribución de probabilidades de
la media muestral. Para ello, en Infostat> Aplicaciones > Didácticas > Todas las muestras posibles. Para todas
las medias muestrales obtenidas calcule la media, DE y grafique. El DE de las medias se conoce como error
estándar (EE). Compare los resultados con la distribución original y concluya.
Repita el procedimiento anterior, pero extrayendo muestras de 10 moscas.

Problema 20. Un tipo de herbivoría frecuente en árboles es la provocada por insectos barrenadores, los que
se caracterizan por la construcción de galerías en tejidos del xilema, floema o corteza mientras se alimentan
durante el estado larval. Holopterus chilensis es un coleóptero barrenador que infesta a Nothofagus obliqua
(roble pellín). El adulto es de color café claro y presenta dimorfismo sexual en tamaño y longitud de antenas.
Las hembras miden en promedio 45 mm de longitud corporal, mientras que los machos miden 42 mm. La
variabilidad en el largo total es en ambos sexos de 1,2 mm. La distribución de la longitud es normal.
1. Grafique ambas distribuciones y compárelas.
2. ¿Cuál es la probabilidad de que un macho elegido al azar presente una longitud mayor a 42,5 mm? ¿Y
una hembra?
Suponga que Ud elige gran cantidad de muestras aleatorias de 10 individuos machos de esta población y
calcula la longitud media de cada muestra.
3. ¿Cuál sería el valor esperado de las medias muestrales?
4. ¿Cuál sería su desvío estándar? ¿Cuál es el otro nombre para este desvío estándar de las medias
muestrales?
5. ¿Cómo es el desvío estándar de las medias muestrales con respecto al desvío estándar de las
longitudes de los machos?
22

6. Si Ud tomase todas las diferentes medias muestrales y construyese un histograma ¿cuál será la forma
de su distribución? ¿A qué distribución de probabilidades cree que ajustaría?
7. ¿Qué proporción de las medias muestrales de la longitud de 10 machos espera que sean mayores
que 42,5 mm?
8. Calcule la proporción pedida en el punto anterior, pero suponiendo que se trabaja con muestras
aleatorias de 20 machos. Grafique ambas distribuciones y compárelas.
9. ¿Qué pensaría si en una nueva población de Holopterus chilensis se eligen al azar 10 machos, se
miden y se obtiene una longitud media de 43,5 mm? ¿Por qué?
10. ¿Qué proporción de las medias muestrales de la longitud de 20 machos espera que se encuentren
entre 41,5 y 42,5 mm?
11. ¿Qué proporción de las medias muestrales de la longitud de 20 hembras espera que superen los 42.5
mm?

Problema 21: Suponga que en una población grande de vacas para producción lechera la producción diaria de
leche sigue una distribución aproximadamente normal, con una media de 22,3 l y una desviación estándar de
3,1 l. Suponga que se toman lotes de 10 vacas de dicha población, se registra la producción diaria de lecha de
cada una y se calcula el promedio de dichos valores.
1. ¿Cuál es el valor esperado de la producción de leche promedio de estas muestras de 10 vacas?
2. ¿Cuál es su desviación estándar?
3. ¿Cuál es su distribución de probabilidades?
4. ¿Cuál es la probabilidad de que una muestra aleatoria de un lote de 10 vacas de esta población tenga
una la producción diaria media de leche mayor que 23 l?
5. Si en vez de un lote de 10 vacas se contase con un lote de 15, la probabilidad calculada en el punto
anterior ¿sería mayor, menor o igual? Justifique su respuesta.

Problema 22: Supongamos que se determinó a partir de ensayos previos que la concentración de hierro en el
suero en hombres sanos sigue una distribución normal con media y desviación estándar de 120 y 15
microgramos por cada 100 ml, respectivamente.
1. ¿Cuál es la probabilidad de que una muestra aleatoria de 50 hombres normales tenga una media entre
115 y 125 microgramos de hierro por cada 100 ml?
2. Suponga que no se conoce la desviación estándar de la población, y se la estimó mediante un
muestreo, obteniendo para dicho estimador un valor de 13 µg/100 ml. Con esta información, ¿cuál es
la probabilidad de que una muestra aleatoria de 10 hombres tenga una media entre 115 y 125 µg/100
ml?
23

Caso 1. Estrategias de desintoxicación de cadmio en un alga


fitoplanctónica
Las especies de algas fitoplanctónicas han desarrollado diversas estrategias de
respuesta celular para minimizar el impacto de metales potencialmente tóxicos,
como el cadmio, presentes en su medio ambiente. Por ejemplo, se ha observado
que una vez internalizado, el metal puede unirse a polipéptidos tiolados conocidos
como fitoquelatinas. Chlamydomonas reinhardtii es un alga unicelular de agua dulce
utilizada ampliamente en investigación ecotoxicológica debido a su resistencia a la
exposición a Cadmio. Sin embargo, se desconocen los mecanismos intracelulares de
desintoxicación involucrados.
Lavoie et al (Aquatic Toxicology 92: 65–75, 2009) llevaron a cabo un estudio a fin de describirlos. Para ello,
prepararon 20 cultivos del alga a una densidad de 40,000 células/mL en medio MHSM-1 a 20 ºC con régimen
de luz continuo y agitación constante a 50 rpm. Los cultivos fueron expuestos a 250 nM de [Cd 2 +] libre
durante 72 h, al cabo de las cuales se midió la concentración intracelular de Cd (en nmoles de Cd/célula).
Asimismo se determinó la concentración de fitoquelatinas, (en nmoles de grupos tiolados/célula). Los
resultados se encuentran en el Anexo.
1) Identifique la unidad experimental, las variables medidas y el tamaño de la muestra. ¿Cuál es la
población de referencia? Clasifique las variables. Indique su unidad de medida.
2) Ingrese los datos en Infostat.

Ingreso de datos: Ir a Archivo →Nueva Tabla. Copiar la matriz de datos del Excel, incluyendo los rótulos de
las columnas. Ir a Edición →Pegar con nombres de columna. En Infostat cada columna corresponde a una
variable distinta.

3) Describa gráficamente la muestra (histograma, box plot).


4) Describa analíticamente la muestra (estadísticos más usuales).
5) Comente la tendencia central, variabilidad y forma de la distribución de las variables analizadas.

Gráficos: Ir a Gráficos →Histograma. Con las funciones de la ventana de Herramientas gráficas puede
modificar distintos aspectos del gráfico como por ejemplo variar el número de rectángulos (clases), los
colores, los valores de los ejes, etc. Otra opción gráfica que permite detectar datos atípicos es el Gráfico de
cajas (Box Plot)

Estadística descriptiva: Ir a Estadísticas →Medidas Resumen. Seleccionar las variables. Aceptar. Seleccionar
los estadísticos que se desee obtener.

6) Estudie la normalidad de las variables mediante un Q-Q plot.

Q-Q plot: Ir a Gráficos →Q-Q plot.

7) Estime la concentración promedio de Cd intracelular en los cultivos de C. reinhardtii con una


confianza del 95%. Repita la estimación con una confianza del 99% y compare.
24

Intervalo de confianza: Ir a Estadísticas→Inferencia basada en una muestra → Intervalos de confianza.


Aparece el cuadro de diálogo para elegir la variable para la cual se desea obtener el IC. Una vez elegida, se le
da Aceptar y obtiene un nuevo cuadro de diálogo en el cual se debe elegir el botón Media e indicar el nivel de
confianza deseado. Luego se le da Aceptar y el programa devuelve los valores de la media muestral, el error
estándar y los límites inferior (LI) y superior (LS) del IC

8) Se desea efectuar una estimación de la concentración promedio de Cd intracelular en otra especie de


alga, Pseudokirchneriella subcapitata, con una confianza del 95% y se desea un error muestral de a lo
sumo 5 nmoles/célula. La dispersión en la concentración de Cd se estimó mediante un muestreo
piloto en 9 nmoles/célula. ¿Qué tamaño de muestra es necesario?

Cálculo de n: Ir a Estadísticas→Cálculo del tamaño muestral→Para estimar una media con una precisión
deseada. Ingresar la amplitud del IC, el nivel de confianza y la varianza de la variable.

9) Repita el cálculo anterior sabiendo que: a) se desea disminuir el error muestral a la mitad; b) se
desea aumentar el nivel de confianza al 99%.
10) En otras especies se ha demostrado que el Cd induce la síntesis de las fitoquelatinas. A fin de
determinar si en este caso existe dicho mecanismo se sometieron cultivos algales a dosis crecientes
de Cd en el medio y se determinó la concentración intracelular de Cd y la de fitoquinas. Analice si
existe relación (lineal o no lineal) entre ambas variables.

Diagrama de dispersión: Ir a Gráficos →Diagrama de dispersión; aparece un cuadro de diálogo donde se


debe indicar la variable correspondiente al eje Y y la variable correspondiente al eje X→Aceptar.

Correlación: Ir a Estadísticas →Análisis de correlación →Coeficientes de correlación; aparece un cuadro de


diálogo donde se debe indicar las dos variables Y →Aceptar. Aparece un cuadro donde se debe seleccionar el
coeficiente de correlación (Pearson)

11) Elabore un informe técnico con las conclusiones del estudio. Acompañe con Tablas o Gráficos
convenientemente rotulados.

Anexo
Cultiv Cadmio Fitoquelatin
o intracelular as
1 546,3 21,2
2 565,4 19,8
3 585,7 21,7
4 681,0 22,6
5 756,1 17,0
6 691,3 25,1
7 554,5 21,9
8 501,8 19,2
9 596,6 19,3
10 555,8 21,1
11 806,8 17,5
12 564,8 22,3
13 488,0 18,2
14 637,6 24,4
15 577,9 19,9
16 602,3 23,3
17 648,6 18,1
18 629,1 24,2
19 597,3 22,9
20 557,1 18,3
25

Bibliografía.
LAVOIE, V., LE FAUCHEUR, S., FORTIN, C. Y CAMPBELL, P.G. (2009) Cadmium detoxification strategies in two
phytoplankton species: metal binding by newly synthesized thiolated peptides and metal sequestration in
granules Aquatic Toxicology, 92: 65–75.

También podría gustarte