Manual Bioestadistica 2002

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 124

UNIVERSIDAD MAYOR DE SAN ANDRÉS

FACULTAD DE AGRONOMÍA
CARRERA DE INGENIERÍA AGRONÓMICA

APUNTES DE BIOESTADISTICA

Juan José Vicente Rojas

La Paz – Bolivia
2002
Apuntes de Bioestadística
La Paz, Bolivia, 2002 Juan José Vicente Rojas

BIOESTADÍSTICA

Definiciones.

“La estadística es la ciencia pura y aplicada encargada de crear, desarrollar y aplicar


técnicas, tal que la incertidumbre de inferencias inductivas puedan evaluarse”

“Es parte del método científico que tiene por objeto la recolección, organización, análisis,
interpretación de datos”

Estadística Descriptiva o Deductiva.

Describe las características de una población en base al análisis de datos obtenidos de una
población en base a una muestra aleatoria.

Estadística Inductiva o Inferencial. Infiere sobre la población en base a las hipótesis


probadas mediante el análisis de datos obtenidos en un experimento.

Población.

Totalidad de los valores posibles (medición o conteo) de una característica particular y


común de un grupo especifico de seres u objetos llamado Universo.

Muestra.
Conjunto de medidas o contadas que son parte de una población.

Observación.
Cada valor que pertenece a una población ( conocido también como elemento o individuo)

Variable.
Toda variable sujeta a medida o conteo representada por x, y , z. Los valores que toma una
variable se denomina dominio de la variable.

1
Apuntes de Bioestadística
La Paz, Bolivia, 2002 Juan José Vicente Rojas

METODOS DE MUESTREO

INTRODUCCION.
Población y Universo: Se entiende por población a; “La totalidad de los valores de una
característica particular de grupo especifico de seres u objetos que se denomina Universo”.
En este concepto el concepto de población se dirige hacia las característica susceptible de
ser contada y/o medida.
Por ejemplo los pesos (Población) de ovejas criollas en cierta comunidad del altiplano.

También se usa frecuentemente Población como sinónimo de Universo.


Selltiz, (1974) citado por Hernández, Fernández y Baptista (1997), define a la población: “Es
el conjunto de todos los casos que concuerdan con un serie de especificaciones”.
Parámetros de una población. Los parámetros son características constantes de una
población, estos parámetros son rara vez conocidos y su estimación es a partir de muestras,
una población normalmente distribuida esta caracterizada por sus parámetros; la media (μ ),
La desviación estándar (σ ), la varianza (σ 2).

El porque del muestreo:


El interés de un investigador se centra en describir lo que pasa con los parámetros
poblacionales, para lo cual en el ejemplo descrito se debería pesar a todas las ovejas de la
comunidad , lo que es muy difícil y más dependiendo del número de ovejas existentes.

Como se describe en el anterior ejemplo el estudio de la totalidad de la población en la


practica es muy difícil, ya sea por razones de tiempo, dinero y esfuerzo, por lo que debemos
remitirnos al empleo de muestras; una muestra se puede definir como un subgrupo de la
población, la cual esta caracterizada por los estadísticos; características variables de la
muestra; la media (x ), desviación estándar (S), la varianza (S2) , los cuales tiene la función
de estimar a los parámetros de la población.

Por lo que se busca a partir de una parte juzgar al todo, para que una muestra sea
considerada representativa de una población debe reunir ciertos requisitos.

Muestra Aleatoria. Caballero (1975): Aquella muestra en la cada observación tiene las
mismas oportunidades que las N que tiene la población de formar parte de la muestra.

METODOS DE MUESTREO.
Existen diversos métodos para obtener una muestra representativa de la población, solo se
describirán los más comunes. Cada método depende de las condiciones en que se presente
la población y los medios y objetivos del investigador, cualquiera que sea el método
seleccionado, el principio de aleatorización es el mismo.

Muestreo Aleatorio Simple (MAS).-

Consiste elegir al azar los individuos seleccionados, para esto es necesario tener
identificados a los individuos de la población, se hace un listado de todos los elementos de la
población, asignando un número a cada uno procediéndose al empleo de números
aleatorios, ya sea a partir de tablas o generados por computadora.

Por ejemplo se desea estudiar la media del Peso Vivo de llamas de la E.E. de Choquenayra,
si la población total es 70 y n = 15, se procede a identificar a cada individuo con número, y
proceder tomar la muestra con los números aleatorios; empleando la tabla, se copian los

2
Apuntes de Bioestadística
La Paz, Bolivia, 2002 Juan José Vicente Rojas

números ≤70, los números que se repitan no se anotan, se repite este proceso hasta tener
n=15.

El muestreo aleatorio simple se aplica cuando la población es homogénea respecto a la


característica de muestreo.

Muestreo Aleatorio Estratificado (MAE).

El Muestreo Aleatorio Simple (MAS), donde las muestras proviene de una sola población, no
siempre es la metodología más eficaz, ya que a veces existen casos en que la población
estudiada presenta estratos naturales (se pueden encontrar grupos dentro de una misma
población), o que la característica analizada no es homogénea , sin embargo dentro de la
población de estudio hay grupos o partes que tienen independientemente, cierta
homogeneidad. En estos casos tal vez es más correcto emplear el Muestreo Aleatorio
Estratificado, donde cada subgrupo corresponde a un estrato.

Ejemplos: Estudio de una población de llamas; los estratos pueden ser

E1 = K‟aras,
E2 = Th‟ampullis.

Estudio de la población de lagartos ; estratos = altitud de hábitat


E1= < 500 msnm, E2=500-600 msnm E3= >600 msnm

Las ventajas con respecto al MAS son:

 Mayor eficiencia al mismo costo


 Mayor información por estrato
 En ocasiones es más sencilla como consecuencia de la manera física y natural en la
que se encuentra ubicada la información.

Con un muestreo estratificado la población se segmenta en subpoblaciones (estratos que


son mutuamente excluyentes y de cada estrato se obtiene una muestra independiente,
simple y aleatoria. (Loetz,1999).

¿cómo se determina el tamaño de muestra por estrato?

a) Asignación proporcional:

 Nj 
nj   *n
N

b) Asignación Optima nj=( Nj x σj / ΣNj σj ) n

donde : nj = Tamaño muestra del j-ésimo estrato


Nj = Total individuos del j-ésimo estrato
N = Total individuos de la población
n = Tamaño de la muestra global calculado con anterioridad
σj = Desviación estándar del j-ésimo estrato

3
Apuntes de Bioestadística
La Paz, Bolivia, 2002 Juan José Vicente Rojas

Un ejemplo de la asignación proporcional:

Población: Llamas de la granja de Choquenayra


N = 70
n =15
E1= k‟aras , N1= 40
E2= th‟ampullis , N2=30

Cual es el tamaño de n para cada estrato: Aplicando la fórmula de asignación proporcional

E1 : n1= (40/70)15 = 8.57 ≈ 9


E2 : n2= (30/70)15 = 6.42 ≈ 7
n = 15
Muestreo Aleatorio Sistemático.

Hernández, Fernández y Baptista (1997); es un procedimiento muy útil y fácil de aplicar e


implica seleccionar dentro de una población N a un número de n elementos a partir de un
intervalo k, k es un intervalo determinado por la relación;

k=N/n.

Ejemplo: para el ejemplo de las llamas de Choquenayra la relación k = 70/15= 4,66 ≈ 5.


Como se tiene identificado a cada individuo de la población en registros y
numerados de 1 a 70 , se procede a tomar un individuo cualquiera y empezar a contar 1, 2,
3, 4, 5 el quinto individuo es parte de la muestra, luego 6,7,8,9,10, el décimo individuo es
parte de la muestra y así sucesivamente, y volver a empezar si es necesario, hasta
completar n = 15.

Reyes Castañeda (1990) da un ejemplo de este tipo de muestreo, en el que sin conocer N,
se procede a muestrear, el ejemplo es; un muestreo de peces de un estanque donde se
decide si después de cada tres redadas la cuarta será parte de la muestra, luego la octava,
etc. Es un procedimiento practico.

Existen otros métodos de muestreo los cuales por la amplitud del tema y su aplicabilidad no
serán estudiados.

4
Apuntes de Bioestadística
La Paz, Bolivia, 2002 Juan José Vicente Rojas

Distribución de frecuencias

Ejemplo.
Altura a la cruz de 40 llamas en cm. realizar la distribución de frecuencias

83 85 87 90 91 93 95
83 86 88 89 91 93 95
84 86 88 89 91 93 96
84 88 88 89 92 94 96
88 89 88 89 89 94 94
89 90 90 89 90

Ordenando de forma ascendente:

83 86 88 89 90 93 95
83 87 88 89 90 93 95
84 88 89 89 91 93 96
84 88 89 89 91 94 96
85 88 89 90 91 94
86 88 89 90 92 94

Calculo del rango:

Rango = Máximo valor – Mínimo valor


Máximo valor = 94
Mínimo valor = 83

Rango = 96 – 83 = 13

Calculo del Número de clases o intervalos:

K = 1 + 3.3 log N
K = 1 + 3.3 log 40
K = 6.28 = 7
K = 7 clases

Tamaño del intervalo del clases ( TIC ):

R 13
TIC  TIC   1.96
K 6.28

1.96 ≈ 2, podemos construir cada clase de dos en dos valores, cada clase es un intervalo de
valores; por ejemplo empezaremos a construir los intervalos desde 83 cm, asi la primera
clase intervalo de valores lo construiremos de 2 unidades; 83 y 84, luego la siguiente clase
85 y 86 asi hasta la séptima clase:

5
Apuntes de Bioestadística
La Paz, Bolivia, 2002 Juan José Vicente Rojas

No clase Clase (cm)


1 83-84
2 85-86
3 87-88
4 89-90
5 91-92
6 93-94
7 95-96
LIC – LSC

El valor inferior de cada clase es el Limite de Clase Inferior (LCI)


El valor superior de cada clase es el Limite de Clase Superior (LCS)

El siguiente paso es determinar la frecuencia (fi) de cada intervalo de clase, esto se refiere a
realizar el conteo de cuantas observaciones caen en cada intervalo, asi del cuadro de datos
ordenados determinamos que entre 83 y 84 cm, existen 4 observaciones;83, 83, 84, 84. De
esta forma tenemos que:

Clase Frecuencia
(cm) fi
83-84 4
85-86 3
87-88 7
89-90 12
91-92 4
93-94 6
95-96 4
Total 40

Calculo del PMC (Punto Medio de Clase o Xi).

El PMC es el valor central del intervalo, se asume que este valor es representativo de cada
intervalo de clases y resulta del promedio del limite de clase inferior y limite de clase
superior:

LIC  LSC
PMC 
2

Asi el punto medio de clase superior para el intervalo 1 es:

83  84
PMC 
2

PMC1 = 83.5

Se recomienda que en lo posible el PMC coincida con valores reales del intervalo.

6
Apuntes de Bioestadística
La Paz, Bolivia, 2002 Juan José Vicente Rojas

De esta forma:

Clase Frecuencia PMC


(cm) fi Xi
83-84 4 83.5
85-86 3 85.5
87-88 7 87.5
89-90 12 89.5
91-92 4 91.5
93-94 6 93.5
95-96 4 95.5
Total 40

Se considera al PMC el valor representativo de cada intervalo, de ahí la razón que se desea
que el PMC sea un valor real observado del intervalo.

Limites verdaderos de clase.

Si observamos bien las clases construidas, vemos que el valor superior de la primera clase
es 84 y el valor inferior de la segunda clase es 85, entre 84 y 85 puede presentarse cualquier
valor, por la naturaleza de continuidad de la variable altura a la cruz, si se presentase por
ejemplo un valor de 84.8 (Que en la practica se presenta), cual sería el intervalo al que
corresponde?. Para esto se deben construir los intervalos de forma tal que no haya
“espacios vacíos” entre estos.

Los Limites Verdaderos se construyen sumando el LSC de un intervalo con el LIC del
siguiente intervalo y dividiendo el resultado entre 2, por ejemplo:

LSC del primer intervalo es =84


LIC del segundo intervalo es =85

84  85
LV 
2

LV = 84.5, este valor debe sustituirse en el lugar de los valores que los produjeron, asi
tenemos;

Clase Frecuencia PMC


(cm) LVC fi Xi
83-84 83-84.5 4 83.5
85-86 84.5-86 3 85.5
87-88 87-88 7 87.5
89-90 89-90 12 89.5
91-92 91-92 4 91.5
93-94 93-94 6 93.5
95-96 95-96 4 95.6

7
Apuntes de Bioestadística
La Paz, Bolivia, 2002 Juan José Vicente Rojas

De esta forma calculamos para todos los limites;

Clase Frecuencia PMC


(cm) LVC fi Xi
83-84 83-84.5 4 83.5
85-86 84.5-86.5 3 85.5
87-88 86.5-88.5 7 87.5
89-90 88.5-90.5 12 89.5
91-92 90.5-92.5 4 91.5
93-94 92.5-94.5 6 93.5
95-96 94.5-96 4 95.6

Para calcular el primer LVC se resta al LVC superior de este intervalo el TIC;

LVC inferior 1 = LVC superior – TIC


LVC inferior 1 = 84.5 – 2 = 82.5

Para calcular el ultimo LVC se suma al LVC inferior de este intervalo el TIC;

LVC superior 7 = LVC inferior + TIC


LVC superior 7 = 94.5 + 2 = 96.5

Finalmente tenemos que;

Clase Frecuencia PMC


(cm) LVC fi Xi
83-84 82.5 - 84.5 4 83.5
85-86 84.5 - 86.5 3 85.5
87-88 86.5 - 88.5 7 87.5
89-90 88.5 - 90.5 12 89.5
91-92 90.5 - 92.5 4 91.5
93-94 92.5 - 94.5 6 93.5
95-96 94.5 - 96.5 4 95.6

La asignación de las observaciones se hacen en función a los Límites Verdaderos de Clase,


las graficas llamadas Histogramas se construyen en función de los limites verdaderos de
clase. ¿Qué pasa si existe un valor de la distribución igual a 84.5, pertenece al primer o
segundo intervalo?, en este caso se deben recurrir a reglas de redondeo y estimar a que
intervalo pertenece esta observación, por ejemplo podríamos redondear a 84 u 85.

Existen diversas formas de construir tablas de frecuencias que se describen en los textos de
Estadística, asi el numero de clases se puede definir con 4√N*2.5 (Reyes, 1995), Martínez
(1997) recomienda que el numero de intervalos o clases se halle entre 5 y 16.

8
Apuntes de Bioestadística
La Paz, Bolivia, 2002 Juan José Vicente Rojas

Frecuencias relativas.

Es expresar la frecuencia de cada clase en términos relativos al total de la muestra, asi la


frecuencia de la primera clase es 4, expresada como porcentaje del total es (4/40) = 10%,
tenemos entonces;

Clase (cm) LVC Frecuencia fi FR%


83-84 82.5 - 84.5 4 10.00
85-86 84.5 - 86.5 3 7.50
87-88 86.5 - 88.5 7 17.50
89-90 88.5 - 90.5 12 30.00
91-92 90.5 - 92.5 4 10.00
93-94 92.5 - 94.5 6 15.00
95-96 94.5 – 96.5 4 10.00
Total 40 100

Frecuencias Acumuladas y Desacumuladas.

Las frecuencias acumuladas (FA) se obtienen sumando la frecuencia de una clase con la
frecuencia de la clase posterior, asi la frecuencia acumulada de la primera clase es igual a su
frecuencia observada ya que antes de esta no hay ninguna clase,

Clase (cm) LVC Frecuencia fi FA


83-84 82.5 - 84.5 4 4
85-86 84.5 - 86.5 3 4+3 7
87-88 86.5 - 88.5 7 7+7 14
89-90 88.5 - 90.5 12 14+12 26
91-92 90.5 - 92.5 4 26+4 30
93-94 92.5 - 94.5 6 30+6 36
95-96 94.5 - 96.5 4 36+4 40

La Frecuencia Relativa Acumulada (FRA) se obtiene de la misma forma;

Clase (cm) LVC Frecuencia fi FR% FA FRA%


83-84 82.5 - 84.5 4 10.00 4 10.00
85-86 84.5 - 86.5 3 7.50 7 17.50
87-88 86.5 - 88.5 7 17.50 14 35.00
89-90 88.5 - 90.5 12 30.00 26 65.00
91-92 90.5 - 92.5 4 10.00 30 75.00
93-94 92.5 - 94.5 6 15.00 36 90.00
95-96 94.5 - 96.5 4 10.00 40 100.00
Total 40 100

Las Frecuencias Desacumuladas (FD) se obtienen de manera inversa, en la primera casilla


se coloca el total de la muestra ya sea en frecuencia ó % y luego se le va descontando el
valor de la misma fila;

9
Apuntes de Bioestadística
La Paz, Bolivia, 2002 Juan José Vicente Rojas

Asi las Frecuencias Desacumuladas son;

Clase (cm) LVC Frecuencia fi FD


83-84 82.5 - 84.5 4 40
85-86 84.5 - 86.5 3 36
87-88 86.5 - 88.5 7 33
89-90 88.5 - 90.5 12 26
91-92 90.5 - 92.5 4 14
93-94 92.5 - 94.5 6 10
95-96 94.5 - 96.5 4 4
Total 40

De la misma forma las Frecuencias Relativas Desacumuladas (FRD);

Clase (cm) LVC FR% FRD%


83-84 82.5 - 84.5 10.00 100.00
85-86 84.5 - 86.5 7.50 90.00
87-88 86.5 - 88.5 17.50 82.50
89-90 88.5 - 90.5 30.00 65.00
91-92 90.5 - 92.5 10.00 35.00
93-94 92.5 - 94.5 15.00 25.00
95-96 94.5 - 96.5 10.00 10.00
Total 100

Finalmente obtenemos el cuadro:

Clase (cm) LVC Frecuencia fi PMC o Xi FR% FA FRA% FD FRD%


83-84 82.5 – 84.5 4 83.5 10 4 10 40 100
85-86 84.5 – 86.5 3 85.5 7.5 7 17.5 36 90
87-88 86.5 – 88.5 7 87.5 17.5 14 35 33 82.5
89-90 88.5 – 90.5 12 89.5 30 26 65 26 65
91-92 90.5 – 92.5 4 91.5 10 30 75 14 35
93-94 92.5 – 94.5 6 93.5 15 36 90 10 25
95-96 94.5 – 96.5 4 95.5 10 40 100 4 10
Total 40 100

Interpretaciones

Primer intervalo:
Clase (cm) LVC Frecuencia fi PMC o Xi FR% FA FRA% FD FRD%
83-84 82.5 - 84.5 4 83.5 10 4 10 40 100

Entre 83 y 84 cm existen 4 observaciones, más propiamente dicho entre 82.5 y 84.5 cm de


altura cruz existen 4 llamas, las cuales representan el 10% del total.
Frecuencias acumuladas:( o Frecuencias menor que) se interpretan en función de los limites
verdaderos de clase superiores:

10
Apuntes de Bioestadística
La Paz, Bolivia, 2002 Juan José Vicente Rojas

Existen 4 llamas con altura cruz menor que 84.5 cm las cuales representan el 10% del total
de la muestra. Esta es una interpretación lógica ya que si en el intervalo existe una
frecuencia de 4 llamas ninguna de estas tendrá altura cruz mayor al limite verdadero de
clase.

Frecuencias desacumuladas: (o Frecuencias mayor que) se interpretan en función de los


limites verdaderos de clase superiores:

Existen 40 llamas con altura cruz mayor que 82.5 cm las cuales representan el 100% de l
total de la muestra. Esto se puede explicar de la siguiente forma, si el primer limite verdadero
inferior es 82.5 cm, obviamente toda las llamas de la muestra tendrán pesos mayores a este
valor, si observamos los valores originales tenemos que la totalidad de las llamas tienen
altura cruz mayores que 82.5 cm

Intervalo de mayor frecuencia.


Clase (cm) LVC Frecuencia fi PMC o Xi FR% FA FRA% FD FRD%
89-90 88.5 - 90.5 12 89.5 30 26 65 26 65

Existen 12 llamas con altura cruz entre 88.5 y 90.5 cm lo que representa un 30%.
Frecuencias acumuladas o menor que: Existen 26 llamas con altura cruz menor que
90.5 cm, lo que representa el 65% del total.
Frecuencias descumuladas o mayor que: Existen 26 llamas con altura cruz mayor que
88.5 cm que representa el 65% del total de la muestra.

Ultimo intervalo
Clase (cm) LVC Frecuencia fi PMC o Xi FR% FA FRA% FD FRD%
95-96 95.5 – 96.5 4 95.5 10 40 100 4 10

Existen 4 llamas con altura cruz entre 95.5 y 96.5 cm lo que representa el 10%.

Frecuencias acumuladas o menor que: Existen 40 llamas con altura cruz menor que 96.5 cm
esto se explica que ninguna llama sobrepasa este limite de clase (ver datos originales). Por
eso estas 40 llamas representan el 100%.

Frecuencias desacumuladas o mayor que: Existen 4 llamas con altura cruz mayor que
95.5 cm lo que representa el 10%

Ejemplo. Notas de aprobación de 50 estudiantes en la materia de Matemáticas en una


Universidad Pública.

77 81 75 82 67 90 60 88 76 93
57 79 88 73 60 93 71 59 85 75
61 65 75 87 73 61 95 78 63 72
66 78 82 75 93 77 69 75 69 60
97 78 89 61 75 95 60 79 83 71

11
Apuntes de Bioestadística
La Paz, Bolivia, 2002 Juan José Vicente Rojas

Antes de realizar los cálculos podemos ordenar los datos en forma ascendente:

57 60 65 71 75 75 78 82 88 93
59 61 66 71 75 76 78 82 88 93
60 61 67 72 75 77 79 83 89 95
60 61 69 73 75 77 79 85 90 95
60 63 69 73 75 78 81 87 93 97

Calculo del rango:

Rango = Máximo valor – Mínimo valor

Del cuadro observamos que el máximo y mínimo valor son 97 y 57:

Rango = 97 – 57
Rango = 40

Calculo del Número de clases o intervalos:

K = 1 + 3.3 log N
K = 1 + 3.3 log 50
K = 6.61 = 7
K = 7 clases

Tamaño del intervalo del clases ( TIC ):

R 40
TIC  TIC 
K 6.61

TIC = 6.05 = 6

Construyendo los intervalos de clase:

Elección del valor inferior

Clases
56 – 61
62 – 67
68 – 73
74 – 79
80 - 85
86 – 91
92 – 97

Cada clase es un intervalo de valores por ejemplo la primera clase o intervalo 1, debe
contener aquellas notas comprendidas entre 56 y 61, el segundo intervalo comprenderá
valores entre 62 y 67.

12
Apuntes de Bioestadística
La Paz, Bolivia, 2002 Juan José Vicente Rojas

El siguiente paso es determinar la frecuencia de cada intervalo de clase, esto se refiere a


realizar el conteo de cuantas notas caen en cada intervalo, asi del cuadro de datos
ordenados determinamos que entre 56 y 61 ptos, existen 9 observaciones; 57, 59, 60, 60,
60, 60, 61, 61, 61. De esta forma tenemos que:

Clases Frec Xi
56 – 61 9
62 – 67 4
68 – 73 7
74 – 79 14
80 – 85 5
86 – 91 5
92 – 97 6
Total 50

Calculo del PMC.

El PMC es el valor central del intervalo, se asume que este valor es representativo de cada
intervalo de clases y resulta del promedio del limite de clase inferior y limite de clase
superior:

LIC  LSC
PMC 
2

Asi el limite de clase superior para el intervalo 1 es:

56  61
PMC 
2

PMC1 = 58.5

De ahora en adelante se asumirá que el valor que represente al primer intervalo de clase, o
en otras palabras el valor que represente a las nueve observaciones del primer intervalo es
la nota de 58.5, es por esto que generalmente se recomienda que en lo posible el valor del
PMC coincida con valores reales observados en dicho intervalo. De esta forma tenemos en
nuestra tabla de frecuencias:

Clases Frec PMC ó Xi


56 – 61 9 58.5
62 – 67 4 64.5
68 – 73 7 70.5
74 – 79 14 76.5
80 – 85 5 82.5
86 – 91 5 88.5
92 – 97 6 94.5
Total 50

13
Apuntes de Bioestadística
La Paz, Bolivia, 2002 Juan José Vicente Rojas

De la misma forma que en el anterior ejemplo se construyen los limites verdaderos de clase
(LVC):

Clases LVC Frec PMC Xi


56 – 61 55.5-61.5 9 58.5
62 – 67 61.5-67.5 4 64.5
68 – 73 67.5-73.5 7 70.5
74 – 79 73.5-79.5 14 76.5
80 – 85 79.5-85.5 5 82.5
86 – 91 85.5-91.5 5 88.5
92 – 97 91.5-97.5 6 94.5
Total 50

Representaciones graficas.

Histograma de frecuencias. Se grafica en función de los limites verdaderos de clase y la


frecuencia observada en cada uno.

Ejemplo: Altura cruz en cm de 40 llamas

Clase (cm) LVC (cm) fi


83-84 82.5 – 84.5 4
85-86 84.5 – 86.5 3
87-88 86.5 – 88.5 7
89-90 88.5 – 90.5 12
91-92 90.5 – 92.5 4
93-94 92.5 – 94.5 6
95-96 94.5 – 96.5 4
Total 40

El Histograma de frecuencias es:

10
Frecuencia

82.5 84.5 86.5 88.5 90.5 92.5 94.5 96.5

altura

14
Apuntes de Bioestadística
La Paz, Bolivia, 2002 Juan José Vicente Rojas

Polígono de frecuencias: Para esto se unen los PMC (Puntos Medios de Clase)

10

Frecuencia
5

82.5 84.5 86.5 88.5 90.5 92.5 94.5 96.5

altura

La Interpretación del histograma y polígono de frecuencias es similar al descrito para la tabla


de frecuencias, se lo realiza en función a los limites verdaderos de clase (LVC) y PMC
respectivamente.

Esquema de Árbol (Stem and Leaf).

Consiste en separar los dígitos de la variable de respuesta de modo que una parte
representen el tallo y el resto las hojas.

Ejemplo.

Notas de aprobación de 50 estudiantes en la materia de Matemáticas en una Universidad


Pública.

77 81 75 82 67 90 60 88 76 93
57 79 88 73 60 93 71 59 85 75
61 65 75 87 73 61 95 78 63 72
66 78 82 75 93 77 69 75 69 60
97 78 89 61 75 95 60 79 83 71

Antes de realizar el árbol podemos ordenar los datos en forma ascendente:

57 60 65 71 75 75 78 82 88 93
59 61 66 71 75 76 78 82 88 93
60 61 67 72 75 77 79 83 89 95
60 61 69 73 75 77 79 85 90 95
60 63 69 73 75 78 81 87 93 97

15
Apuntes de Bioestadística
La Paz, Bolivia, 2002 Juan José Vicente Rojas

El árbol consistirá en separar el primer digito hacia la izquierda de modo que constituya el
tallo, luego se completa el valor observado a la derecha del tallo:

5 7 9
6 0 0 0 0 1 1 1 3 5 6 7 9 9
7 1 1 2 3 3 5 5 5 5 5 5 6 7 7 8 8 8 9 9
8 1 2 2 3 5 7 8 8 9
9 0 3 3 3 5 5 7

De esta forma tenemos que la mínima nota tiene valor de 57, la máxima nota es 97, la
mayoría de las notas se agrupan entre 71 y 79, la nota que mas se repite es 75, se repite 6
veces.

Ejemplo.
En la siguiente tabla los pesos de 40 estudiantes de una universidad estatal se registran con
aproximación de una libra (Spiegel, 1988).

138 164 150 132 144 125 149 157


146 158 140 147 136 148 152 144
168 126 138 176 163 119 154 165
146 173 142 147 135 153 140 135
161 145 135 142 150 156 145 128

Resultado:

11 9
12 5 6 8
13 2 5 5 5 6 8 8
14 0 0 2 2 4 4 5 5 6 6 7 7 8 9
15 0 0 2 3 4 6 7 8
16 1 3 4 5 8
17 3 6

El mínimo peso es 119, la mayor frecuencia se agrupa entre 140 y 149 lb posiblemente en
este intervalo se halle la media aritmética, el máximo peso 176 lb, el peso de mayor
frecuencia es 135 lb (3 veces).

Comparando un esquema de árbol con la tabla de frecuencias se pueden puntualizar


algunas diferencias:

Ventajas Desventajas
Distribución de Presenta en forma reducida Perdida de información
frecuencias gran cantidad de información original e individual
Esquema de No se pierde información A medida que el numero de observaciones
árbol Individual crece su interpretación ya no es tan sencilla

16
Apuntes de Bioestadística
La Paz, Bolivia, 2002 Juan José Vicente Rojas

Otra forma de presentar los datos es agrupándolos de la siguiente forma:

140
140
142
142
144
144
145 150
132 145 150
135 146 152
135 146 153 161
135 147 154 163
125 136 147 156 164
126 138 148 157 165 173
119 128 138 149 158 168 176

Es similar a un histograma de frecuencias y habla por si sola.

17
Apuntes de Bioestadística
La Paz, Bolivia, 2002 Juan José Vicente Rojas

Medidas de Tendencia Central

Datos no agrupados.

Es decir para datos que no se hallan bajo la estructura de una tabla de frecuencias

a) Media Aritmética.

Es la medida de tendencia central más común, algunas de sus propiedades son (Caballero,
1975):
 La suma algebraica de las observaciones de un conjunto de números con respecto a
su media es igual a cero: Σ (x – x) = 0
 La suma de los cuadrados de las desviaciones de un grupo de números con respecto
a su media es un mínimo: Σ (x – x)2 = mínimo

x1  x2  x3  ...  xn
x
n

x
i 1
Se interpreta como el valor alrededor del cual se agrupan la
x 1
mayoría de las observaciones.
n
Ejemplo.

Los datos que se ofrecen a continuación corresponden al peso de 29 terneros recién nacidos
(Caballero, 1975):

22 31 33 34 35 36 37 38 38 39
40 40 40 41 41 42 42 42 42 42
43 43 44 45 46 46 46 46 50

Calcular la media aritmética:

22  31  33  34  ...  50
x
29

x = 40.13 kg, el peso promedio al nacer de los 29 terneros oscila alrededor de 40.13 kg, la
mayoría de los pesos al nacer de los terneros se encuentra alrededor de 40.13 kg.

b) Media ponderada.

x1w1  x1w2  ...  xn wn


xp 
w1  w2  ...  wn

Su interpretación es similar al de la media aritmética, su diferencia radica que a cada


observación (x) se asocia un factor de importancia relativa (información adicional) llamado
factor de ponderación (w). Esto hace que se dé a las cantidades que se estén promediando
su grado de importancia adecuado (peso).

18
Apuntes de Bioestadística
La Paz, Bolivia, 2002 Juan José Vicente Rojas

Ejemplo.

El peso promedio al destete de lechones y el numero de lechones de 5 granjas, son:

Peso Numero de
Granja (kg) lechones
A 18.8 567
B 21.3 432
C 23.5 321
D 20.2 300
E 23.4 205

Cual es el peso promedio de destete?:

Como es el peso al destete la variable que nos interesa llamemos a ésta x, la cual tiene una
información adicional (peso o factor de ponderación; w).

Calculo de la media ponderada:

18.8 * 567  21.3 * 432  23.5 * 321  20.2 * 300  23.4 * 205
xp 
567  432  321  300  205

xp = 20.96 kg

El peso al destete de las 4 granjas porcinas oscila alrededor de 20.96 kg.

Ejemplo.

En una tienda se venden 3 marcas de leche envasada a 4.10, 4.20, 4.30 $ cada lata, en un
dia cualquiera se venden latas de los tres precios; 23 latas de 4.20 $, 72 latas de 4.10 $ y 5
latas de 4.30 $ (Caballero, 1975).

Calculo de xp:

Sea el precio $, la variable x con un factor de ponderación w, que es el número de latas:

(4.20 * 23)  (4.10 * 72)  (4.30 * 5 )


xp 
23  72  5

xp = 4.13 $/lata

El precio promedio de venta por lata para tal dia es de 4,13 $/lata

19
Apuntes de Bioestadística
La Paz, Bolivia, 2002 Juan José Vicente Rojas

c) Media Armónica (Ma).

n
Ma 
1 1 1
  ... 
x1 x 2 xn

Su uso mas frecuente es promediar velocidades obtenidas al recorrer distancias iguales


(Caballero, 1975).

Ejemplo.
Calcular la media armónica de la velocidad alcanzada en un circuito de carreras por 3
automóviles cuya velocidad respectiva fue: (Gutiérrez, 1982).

V1 = 150 km/h
V2 = 175 km/h
V3 = 165 km/h

Solución:

n = 3 ( el número de velocidades)
3
Ma 
1 1 1
 
150 175 165
Ma = 162.67

Ejemplo.
Las distancias entre las ciudades A, B, C, D, E, F es de 50 km entre cada una de ellas, un
vehículo recorrió a una velocidad media de 30 km/h el tramo entre A y B, luego de B a C
empleo una velocidad media de 70 km/h, de C a D 65 km/h, de D a E 45 km/h y de E a F
80 km/h. ¿Cuál fue el promedio de velocidad empleado entre las ciudades A y F?.

Solución:

n=5
VAB = 30 km/h
VBC = 70 km/h
VCD = 65 km/h
VDE = 45 km/h
VEF = 80 km/h

5
Ma 
1 1 1 1 1
   
30 70 65 45 80

Ma = 51.16 km/h

20
Apuntes de Bioestadística
La Paz, Bolivia, 2002 Juan José Vicente Rojas

d) Media Geométrica (Mg).

Usada cuando la relación entre dos números consecutivos es constante o aproximadamente


constante, por ejemplo; el tamaño de una población en intervalos consecutivos de tiempo
(Caballero, 1975).

Mg  n x1 * x2 *... * xn

Ejemplo.

El % de parición de vacas mestizas en el cordón lechero fue (Loetz, 1999):

Año 1990 1991 1992 1994


Pariciones 640 615 550 625
% respecto al año anterior 96.1 89.4 113.6

Cual fue el % de parición promedio?

Si empleamos la media aritmética:

96.1  89.4  113.6


x
3

x = 99.7%, lo que sugiere 100 – 99.7 = 0.3 % de decremento anual

Empleando la Media geométrica:

Mg  3 96.1* 89.4 *113.6

Mg = 99.19 % de parición promedio

100 – 99.19 = 0.81%, esto representa una tasa de decremento mayor al calculado con la
media aritmética. Este procedimiento es útil para poder predecir los cambios de una variable
en intervalos de tiempo.

21
Apuntes de Bioestadística
La Paz, Bolivia, 2002 Juan José Vicente Rojas

e) Mediana.

La mediana es el valor central de la distribución, es aquella observación que divide en dos


partes iguales a la distribución, de modo que el 50% de estas se hallen por debajo de este
valor y el 50% restante se hallen por encima de este valor.

De acuerdo a Freund y Manning (1989) se emplea para evitar confundirse por causa de
algunos valores muy pequeños o muy grandes, por lo que es preferible describir la “mitad” o
el “centro” de un conjunto de datos con medidas estadísticas diferentes de la media.

 Cuando n es impar, la mediana es el valor del elemento que esta a la mitad


cuando los elementos están ordenados ya sea en forma ascendente o
descendente.
 Cuando n es par, la mediana es el promedio de los dos elementos que están
más próximos a la mitad, cuando los elementos están ordenados ya sea en
forma ascendente o descendente.

Ejemplo. Calcular la mediana de 12, 10, 15, 18, 8, 22, 15

Solución:

Siendo n = 7 y los datos ordenados de forma ascendente:

8 10 12 15 15 18 22

Como se indico anteriormente para un numero impar de observaciones la mediana es el


valor central, en este caso 15, por debajo y encima de este valor existe el mismo número de
observaciones.

8 10 12 15 15 18 22

Ejemplo. Calcular la mediana de: 5, 4, 6, 7, 5, 8

Ordenados los datos de menor a mayor y siendo n = 6:

4 5 5 6 7 8

las observaciones centrales son 5 y 6, por lo tanto la mediana será el promedio de estos
observaciones: (5 + 6)/2= 5.5

4 5 5 Me 6 7 8
5.5

Como determinar la ubicación de la mediana: Con la práctica la posición de la mediana se la


realiza por simple inspección, como ayuda se pueden dar las siguientes pautas:

22
Apuntes de Bioestadística
La Paz, Bolivia, 2002 Juan José Vicente Rojas

Si n es impar:

n 1
2

Ejemplos.

Para n = 15

15  1
8
2

La posición de la mediana es la observación Nº 8

Para n = 51
51  1
 26
2

la mediana será el valor de la observación 26

Para n par: buscamos las observaciones más cerca del centro de la distribución

n
2

Para n = 20
20
 10
2

la mediana será el promedio de la observación 10 y la siguiente que es 11

Para n = 24, la mediana será el promedio de los valores de las observaciones 12 y 13


Para n = 30, la mediana será el promedio de los valores de las observaciones 15 y 16
Para n = 36, la mediana será el promedio de los valores de las observaciones 18 y 19

23
Apuntes de Bioestadística
La Paz, Bolivia, 2002 Juan José Vicente Rojas

Ejemplo.

Los datos que se ofrecen a continuación corresponden al peso de 29 terneros recién nacidos
(Caballero, 1975):

22 31 33 34 35 36 37 38 38 39
40 40 40 41 41 42 42 42 42 42
43 43 44 45 46 46 46 46 50

Calcular la mediana:

Solución:

Siendo n = 29;
29  1
 15
2

Num obs 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
Peso 22 31 33 34 35 36 37 38 38 39 40 40 40 41 41 42 42 42 42 42

21 22 23 24 25 26 27 28 29
43 43 44 45 46 46 46 46 50

La mediana será el valor central de la distribución; la observación Nº 15 = 41 kg, por debajo


de este peso se hallan tantas observaciones como por encima de él. 50% de los terneros
tienen pesos menores o iguales a 41 kg y 50% pesos mayores o iguales.

f) Moda.

La moda es el valor que más se repite en una distribución

Ejemplo.

Los datos que se ofrecen a continuación corresponden al peso de 29 terneros recién nacidos
(Caballero, 1975):

22 31 33 34 35 36 37 38 38 39
40 40 40 41 41 42 42 42 42 42
43 43 44 45 46 46 46 46 50

Calcular la moda:

Solución:
El valor de mayor frecuencia es 42 con frecuencia igual a 5

24
Apuntes de Bioestadística
La Paz, Bolivia, 2002 Juan José Vicente Rojas

Ejercicios.

En la localidad de Challapata, se estimaron los rendimientos de alfalfa en tn/ha en las


propiedades de 20 campesinos:

4.7 2.8 5.3 3.2


3.3 4.2 4.0 2.9
2.5 3.0 5.8 6.2
2.0 2.5 4.5 3.0
3.6 6.0 3.6 4.2

Calcular e interpretar la Media, Mediana y Moda:

Media)
4.7  3.3  2.5  2.0  ...  4.2
x
20

x = 3.865 tn/ha, Los rendimientos de la mayoría de los 20 campesinos oscilan alrededor de


3.865 tn/ha.

Mediana) Ordenando los datos de menor a mayor

2 3 3.6 4.7
2.5 3 4 5.3
2.5 3.2 4.2 5.8
2.8 3.3 4.2 6
2.9 3.6 4.5 6.2

Como el numero de observaciones es par, podemos esperar que el valor de la mediana se


halle entre el promedio de las observaciones 10 y 11: (3.6 + 3.6)/2 = 3.6, 50% de las
parcelas pertenecientes a los campesinos tendrán rendimientos menores o iguales a 3.6
tn/ha. y el 50% restante tendrá rendimientos iguales o superiores a 3.6 tn/ha.

Moda) de los datos ordenados por magnitud podemos determinar que los valores con mayor
frecuencia son; 2.5, 3.0, 3.6 y 4.2 tn/ha cada uno con una frecuencia de 2, en esta
distribución el valor modal no esta bien definido.

25
Apuntes de Bioestadística
La Paz, Bolivia, 2002 Juan José Vicente Rojas

Medidas de Dispersión.

Rango. R = Máximo valor – Mínimo Valor

Varianza.

Promedio de los desvíos de las observaciones con relación a la media elevados al cuadrado,
o simplemente el promedio de desvíos al cuadrado.

Varianza de la Población (N>30)

 2

(x i   )2 Formula de definición (desvíos)
N

 x
 x  N
2
2
Fórmula de computación
2 
N

Varianza de la muestra (n < 30)

S 2

(x i  x) 2
n 1

 x
 x  n
2
2

S2 
n 1

Desviación Estándar. Representa el desvió de la mayoría de las observaciones en torno a


la media.

Desvío Estándar de la Población (N>30)

  (x i   )2
N

 x  2

x
2

 N
N

26
Apuntes de Bioestadística
La Paz, Bolivia, 2002 Juan José Vicente Rojas

Desvío Estándar de la muestra (n < 30)

S
(x i  x) 2
n 1

 x
 x  n
2
2

S
n 1

Coeficiente de Variación (CV).

Se interpreta como el Desvió estándar en términos proporcionales a la media aritmética, el


CV indica el grado de dispersión de las observaciones alrededor de la media, elevados
valores de CV indicaran un alto grado de variabilidad y bajos valores de CV, indican una baja
dispersión de las observaciones alrededor de la media.

S
CV    x100
X

Ejercicio.

En la localidad de Challapata, se estimaron los rendimientos de alfalfa en las propiedades de


20 campesinos:

4.7 2.8 5.3 3.2


3.3 4.2 4.0 2.9
2.5 3.0 5.8 6.2
2.0 2.5 4.5 3.0
3.6 6.0 3.6 4.2

Calcular e interpretar la Media, Varianza, Desvió Estándar y CV:

Media)
4.7  3.3  2.5  2.0  ...  4.2
x
20

x = 3.865, Los rendimientos de la mayoría de los 20 campesinos oscilan alrededor de 3.865


tn/ha

27
Apuntes de Bioestadística
La Paz, Bolivia, 2002 Juan José Vicente Rojas

Varianza)

Con la formula:

Donde:
 x
 x  n
2
2

S2 
n 1
n = 20
Σx = 4.7 + 3.3 + 2.5 +...+ 4.2 = 77.3
Σx2 = 4.72 + 3.32 + 2.52 +...+ 4.22 = 327.59

Reemplazando:

327.59 
77.3
2

S2  20
20  1

S2 = 1.517

Promedio de desviaciones al cuadrado de difícil interpretación,

Desviación Estándar)

S = √1.157
S = 1.231

La mayoría de los rendimientos de las propiedades de los 20 campesinos se desviara en


promedio ± 1.23 tn/ha de la media (3.865)

Coeficiente de variación (CV).

 1.23 
CV    x100
 3.865 

CV = 31.82 %

El desvió estándar representa el 31.82% de la media (3.865), podemos decir que existe un
alto grado de variación de los rendimientos en torno a su media.

28
Apuntes de Bioestadística
La Paz, Bolivia, 2002 Juan José Vicente Rojas

Ejemplo.

Los datos que se ofrecen a continuación corresponden al peso de 29 terneros recién nacidos
(Caballero, 1975):

22 31 33 34 35 36 37 38 38 39
40 40 40 41 41 42 42 42 42 42
43 43 44 45 46 46 46 46 50

Calcular e interpretar la media, varianza, desvió estándar y CV:

Media)

x = 40.13 kg, la mayoría de los 29 terneros que nacen tienen pesos alrededor de 40.13 kg.

Varianza)

 x
 x  n
2
2

S2 
n 1
n = 29
Σx = 22 + 31 + 33 +...+ 50 = 1164
Σx2 = 4.72 + 3.32 + 2.52 +...+ 4.22 = 47594

Reemplazando:

47594 
11642
S2  29
29  1

S2 = 31.19 kg2

Promedio de los desvíos con respecto a la media elevados al cuadrado

Desvío Estándar)

S = √31.19 kg = 5.58 kg
Los pesos al nacimiento de los terneros se desviaran en promedio ± 5.58 kg de la media
(40.13 kg).

Coeficiente de variación.

 5.58 
CV    x100
 40.13 
CV = 13.90 %
El desvió estándar del peso al nacimiento de terneros representa el 13.90% de la media.

29
Apuntes de Bioestadística
La Paz, Bolivia, 2002 Juan José Vicente Rojas

Ejemplo.
En la siguiente tabla los pesos de 40 estudiantes de una universidad estatal se registran con
aproximación de una libra (Spiegel, 1988).

138 164 150 132 144 125 149 157


146 158 140 147 136 148 152 144
168 126 138 176 163 119 154 165
146 173 142 147 135 153 140 135
161 145 135 142 150 156 145 128

Calcular la media, varianza, desvió estándar, CV:

Media)
x = 146.8 lb, la mayoría de los pesos de los estudiantes oscilara alrededor de 146.8 lb.

Varianza)

Con la formula:
 x
 x  N
2
2

2 
N

N = 40
Σx = 138 + 146 + 168 +...+ 128 = 5872
Σx2 = 1382 + 1462 + 1682 +...+ 1282 = 868652

Reemplazando:

868652 
58722
2  40
40
σ2 = 166.06 lb2
Promedio de los desvíos al cuadrado

Desvió Estándar)

σ = √166.06 lb2 = 12.88 lb

La mayoría de los pesos de los estudiantes se desviaran en ± 12.88 lb de la media (146.8 lb)

Coeficiente de Variación (CV).


 12.88 
CV    x100
 146.8 
CV = 8.77 %, el desvío estándar de los pesos de los estudiantes representa el 8.77% del
promedio (146.8 lb), existe un bajo grado de dispersión.

30
Apuntes de Bioestadística
La Paz, Bolivia, 2002 Juan José Vicente Rojas

Estadísticos descriptivos para datos agrupados en una tabla de frecuencia.

Ejemplo.
Calcular la media, desvío estándar, varianza y CV de las Altura a la cruz de 40 llamas en cm.
Los datos originales y la tabla de frecuencia se ofrecen a continuación.

83 85 87 90 91 93 95
83 86 88 89 91 93 95
84 86 88 89 91 93 96
84 88 88 89 92 94 96
88 89 88 89 89 94 94
89 90 90 89 90

Con datos originales:


Media Aritmética = 89.65 cm
Varianza = 11.677 cm2
Desvío Estándar = 3.41 cm
CV = 3.80%

Tabla de frecuencias. necesitamos calcular fi*Xi y fi*Xi2:


2
Clase (cm) LVC Frecuencia fi PMC o Xi fi*Xi fi*Xi
83-84 82.5 - 84.5 4 83.5 334 27889
85-86 84.5 - 86.5 3 85.5 256.5 21930.75
87-88 86.5 - 88.5 7 87.5 612.5 53593.75
89-90 88.5 - 90.5 12 89.5 1074 96123
91-92 90.5 - 92.5 4 91.5 366 33489
93-94 92.5 - 94.5 6 93.5 561 52453.5
95-96 95.5 - 97.5 4 95.5 382 36481
2
Total n ó Σ fi =40 Σ fi*Xi =3586 Σ fi*Xi =321960

Media aritmética:

x
 fi * Xi x
3586
 fi 40

x = 89.65 cm
Varianza:

( fi * xi ) 2
 fi * xi 2 
2  N
N
Asumiremos que la varianza es poblacional ya que en tablas de frecuencia el tamaño de la
muestra generalmente es mayor a 30.
(3586) 2
321960 
2  40
40
σ2= 11.87 cm2

31
Apuntes de Bioestadística
La Paz, Bolivia, 2002 Juan José Vicente Rojas

Desvió Estándar:

( fi * xi ) 2
 fi * xi 2

N
2 
N

σ= √11.87 cm2
σ= 3.44 cm

Coeficiente de Variación:

   3.44 
CV    *100 CV    *100
  89.65 

CV = 3.83%

Si comparamos los valores obtenidos con datos originales y la tabla de frecuencia:

Datos originales Tabla de frecuencias


Media 89.65 cm 89.65 cm
2 2
Varianza 11.67 cm 11.87 cm
Desvió Estándar 3.41 cm 3.44 cm
CV 3.80 % 3.83 %

Los resultados con tablas de frecuencias generalmente varían respecto a los calculados con
datos originales, la diferencia entre estos se llama error de agrupamiento, mientras mas
pequeña sea la diferencia, mejor estará representada la variable en la tabla de frecuencia.

32
Apuntes de Bioestadística
La Paz, Bolivia, 2002 Juan José Vicente Rojas

PROBABILIDADES

Experimento. Procedimiento establecido para obtener datos, tiene mas de un resultado y es


teóricamente repetible se representa por S.

Espacio muestral. Conjunto de resultados posibles asociados a un experimento


determinado.

Suceso Elemental. Cada uno de los posibles resultados de un experimento, también se


conoce como resultado elemental.

Evento. Colección de sucesos elementales, subconjunto del espacio muestral.


Probabilidad. La probabilidad de un evento A:

Numero de resultados elementale s con caracteris tica A (*)


P( A) 
Numero de resultados elementale s totales

Es la frecuencia relativa de aparición de un evento

Distribución de probabilidad. Probabilidades asociadas con los valores de una variable


aleatoria. Totalidad de valores de probabilidad de los eventos de un espacio muestral.

Reglas básicas de probabilidad.

1. Las probabilidades son números reales situadas en el intervalo 0 a 1; 0≤P(A) ≤1


2. La probabilidad del espacio muestral es igual a 1; la suma de las probabilidades de
que ocurra un evento y de que no ocurra es igual a 1.
3. Si dos eventos son mutuamente exclusivos, la probabilidad de que uno o el otro
ocurran es igual a la suma de sus posibilidades

P(AUB) = P(A) + P(B)

Ejercicio.

Sea el experimento lanzamiento de un dado, el espacio muestral “S” es;

S = {1, 2, 3, 4, 5, 6} numero de elementos = 6

Sea el evento A: “Que salga un numero par”

A = {2, 4, 6} número de elementos = 3

¿Cuál es la probabilidad de obtener un numero par al lanzar un dado?

Empleando la relación (*), existen 3 elementos que cumplen la característica “número par” de
6 posibles:

P(A) = 3/6 = 1/2


P(A) = 1/2

33
Apuntes de Bioestadística
La Paz, Bolivia, 2002 Juan José Vicente Rojas

Eventos mutuamente exclusivos.


Dos eventos son mutuamente exclusivos si la ocurrencia de uno de ellos implica la NO
ocurrencia del otro. Dos eventos son mutuamente exclusivos cuando No tiene elementos en
común; A∩B = Ø , la intersección de A con B es el conjunto vacío.

Sea el lanzamiento de un dado con espacio muestral:

Sea A el evento “que salga un numero par”


Sea B el evento “que salga un numero mayor a 4”
Sea C el evento “que salga 5”

Los elementos de cada evento son:

A = {2, 4, 6}
B = {5, 6}
C = {5}

¿Son A y B mutuamente exclusivos?

Para que A y B sean mutuamente exclusivos debe cumplirse: A∩B = Ø, veamos:

A∩B = {6}, la intersección de A y B es diferente del conjunto vacío, no se cumple A∩B = Ø,


por lo tanto los Eventos No son mutuamente excluyentes, tienen un elemento en común, si
por casualidad al lanzar el dado sale el numero 6, se puede decir que los dos eventos
ocurren al mismo tiempo.

34
Apuntes de Bioestadística
La Paz, Bolivia, 2002 Juan José Vicente Rojas

¿Son A y C mutuamente exclusivos?

A∩B = Ø, como A y C no tienen elementos en común se puede decir que son mutuamente
exclusivos, si por casualidad ocurriese un 6, no ocurrirá el evento C “que salga el 5”.

Ejemplo.
Para el ejemplo del lanzamiento del dado cual es la probabilidad de P(AUC)?
P(AUC) = P(A) + P(C), esta relación se aplica cuando los eventos son excluyentes

A = {2, 4, 6}; P(A) = 3/6 =1/2


C = { 5}; P(C) =1/6

P(AUC) = 1/2 + 1/6= 4/6 =2/3


P(AUC) = 2/3

Ejemplo.
Para el ejemplo del lanzamiento del dado cual es la probabilidad de P(AUB)?
P(AUB) = P(A) + P(B) - P(A∩B), esta relación se aplica cuando los eventos pueden ser o no
excluyentes

A = {2, 4, 6}; P(A) = 3/6 =1/2


B = { 5, 6} P(B) = 2/6 = 1/3
A∩B = {6} P(A∩B) = 1/6

P(AUB) = 1/2 + 1/3 – 1/6 =4/6 =2/3


P(AUB) = 2/3

Ejemplo.
Sea el experimento “lanzamiento de una moneda” y A : “ que salga cara”, B :”que salga cruz”
¿Son A y B mutuamente exclusivos?

Recordando que dos eventos son mutuamente exclusivos cuando la ocurrencia de uno
implica la no ocurrencia del otro evento, si sale cara esto implicara que no salga cruz, por lo
tanto los dos eventos son mutuamente excluyentes.

35
Apuntes de Bioestadística
La Paz, Bolivia, 2002 Juan José Vicente Rojas

Probabilidad Condicional.

P( A  B)
P( A / B ) 
P( B)

Se denota como la probabilidad de que ocurra el evento A sabiendo que el evento B ya ha


ocurrido.

Ejercicio.
Calcular la probabilidad de obtener un 2 al lanzar un dado al aire sabiendo que se ha
obtenido un número impar (Gutiérrez, 1982).

A: Que salga; A = {2}


B: Obtener un número impar, B ={1, 3, 5},

del diagrama; A∩B = Ø

En términos de probabilidad:
P(A) = 1/6
P(B) = 1/2
P(A∩B) = 0 es la probabilidad de ocurrencia de un conjunto vacío

P( A  B) 0
P( A / B )  P( A / B ) 
P( B) 1/ 2

P(A/B) = 0

La probabilidad de sacar un 2 en el lanzamiento de un dado sabiendo que se ha obtenido un


numero impar es 0. Es imposible obtener un 2 sabiendo que se ha obtenido un numero
impar.

36
Apuntes de Bioestadística
La Paz, Bolivia, 2002 Juan José Vicente Rojas

Ejercicio.

Calcular la probabilidad de obtener un 2 al lanzar un dado al aire sabiendo que se ha


obtenido un numero par.

A: Que salga; A = {2}


B: Obtener un número par, B ={2, 4, 6},
A∩B = {2}

En probabilidad:

P(A) = 1/6
P(B) = 1/2
P(A∩B) = 1/6

P( A  B) 1/ 6
P( A / B )  P( A / B ) 
P( B) 1/ 2

P(A/B) = 1/3, es la probabilidad de obtener un 2 sabiendo que se ha obtenido un número par.

Eventos independientes.

El evento A es independiente del evento B si la probabilidad del evento A no se ve afectada


por la incidencia o no de B. Para que A y B sean independientes se puede emplear la regla
de multiplicación:

P(A∩B) = P(A) * P(B)

Ejercicio.

Si P(A) = 0.65, P(B) = 0.4 y P(A∩B) = 0.26 ¿son independientes A y B?

Verificando la igualdad P(A∩B) = P(A) * P(B)

0.26 = 0.65 * 0.4


0.26 = 0.26

Como se cumple la igualdad P(A∩B) = P(A) * P(B), A y B SON independientes, ya que el


producto de P(A) por P(B) es igual a P(A∩B) .

37
Apuntes de Bioestadística
La Paz, Bolivia, 2002 Juan José Vicente Rojas

Ejercicio.

Determinar si los eventos A y B son independientes:

P(A∩B) = 0
P(A) = 1/6
P(B) = 1/2

Verificando: 0 = (1/6)*(1/2)
0 = 1/12
finalmente concluimos:
0 ≠ 1/12

Como no se cumple la igualdad (P(A∩B) = P(A) * P(B)), los eventos A y B NO son


independientes, la ocurrencia de uno altera la probabilidad de ocurrencia del otro evento.

Ejercicios.
Ejercicio.
Cual es la probabilidad de que la próxima persona que conozcamos haya nacido en marzo o
abril?¿Cuál la probabilidad de que no haya nacido ni en marzo ni en abril?.

Solución:
P(nacido en marzo o abril) = 2/12 = 1/6, ya que son dos los meses favorables de 12 posibles
P(no nacido en marzo ni abril) = 1 – P(nacido en marzo o abril)
P(no nacido en marzo ni abril) = 5/6

Ejercicio.
¿Cuál es la probabilidad de obtener al menos una cara al lanzar dos monedas al aire?
Solución:

Espacio muestral; S = {cara-cara, cara-cruz, cruz-cara, cruz-cruz}

Son todas los posibles resultados del experimento. Los casos favorables son los tres
primeros (al menos una cara):

P(al menos una cara) = ¾ = 0.75


Ejercicio.
Cual es la probabilidad de tomar un as de una baraja bien barajada?

Solución:
Hay 4 ases entre las 52 cartas de manera que;

P(1 as) = 4/52 =1/13

38
Apuntes de Bioestadística
La Paz, Bolivia, 2002 Juan José Vicente Rojas

Ejercicio.
Determinar la probabilidad de obtener un as o un rey o un 2, cuando se saca una carta de
una baraja bien mezclada de 52 cartas.

Solución:

A = “Que salga 1 as” P(A) = 4/52


B = “Que salga 1 rey” P(B) = 4/52
C = “Que salga un 2” P(C) = 4/52

Son eventos mutuamente exclusivos de modo que si sale un as no saldrá al mismo tiempo
un rey o un dos, de modo que:

P(Obtener un as o un rey o un 2) = P(AUBUC) = P(A) + P(B) + P(C)

P(Obtener un as o un rey o un 2) = 4/52 + 4/52 + 4/52 = 12/52 = 3/13


P(Obtener un as o un rey o un 2) = 3/13

Ejercicio.
El siguiente representa una caja con bolitas de color donde R = bola roja, V = bola verde y
A = bola azul, si cada bola tiene escrito un número:

Sea el experimento extraer una bolita


Sea el evento A: “que la bolita sea Azul
Sea el evento B:“Que la bolita tenga el
número 2”
a) Son A y B mutuamente exclusivos?
b) Son A y B independientes?

Solución:

A = {3A, 4A, 2A} en probabilidad; P(A) = 3/7


B = {2A} en probabilidad; P(B) = 1/7
A∩B = {2A} en probabilidad; P(A∩B) = 1/7
a) Para que A y B sean mutuamente exclusivos no deben tener elementos en común, por lo
tanto A∩B = Ø , vemos que esta condición no se cumple ya que

A∩B = {2A } ≠ Ø

39
Apuntes de Bioestadística
La Paz, Bolivia, 2002 Juan José Vicente Rojas

Los eventos A y B NO son mutuamente exclusivos

b) la regla de independencia P(A∩B) = P(A) * P(B), verificando la igualdad;

1/7 = (3/7)*(1/7)
1/7 = 3/49
1/7 ≠ 3/49 Como no se cumple la igualdad; Los eventos A y B NO son independientes

Ejercicio.
Cual es la probabilidad de obtener 2 águilas en dos lanzamientos al aire de una moneda
equilibrada?.

Solución:
Se emplea la regla de multiplicación para eventos independientes, la probabilidad obtener
águila en un lanzamiento es ½ , la probabilidad de ocurrencia en el siguiente lanzamiento es
independiente del primer resultado:

P(2 águilas en dos lanzamientos) = (1/2)*(1/2) = ¼

Ejercicio.
Cual es la probabilidad de obtener dos ases seguidos cuando se toman dos cartas de una
baraja de 52 cartas si a) Se sustituye la primera carta antes de sacar la segunda b) No se
sustituye la primera carta antes de sacar la segunda

Solución:

a) La probabilidad de sacar un as es 4/52 en una extracción, esta probabilidad es inalterable


en una segunda extracción si se vuelve a mezclar la carta extraída en la baraja.

P(2 ases en dos extracciones) = (4/52)*(4/52) = 16/2704 = 1/169

b) La probabilidad de sacar un as en la primera extracción es 4/52, si no se devuelve la


primera carta y asumiendo que esta es un as la probabilidad de volver a extraer un as en la
segunda extracción es 3/51 (Solo hay 3 ases en 51 cartas)

P(2 ases en dos extracciones) = (4/52)*(3/51) = 12/2652 = 1/221

Ejercicio.
Cuales son los errores en los siguientes enunciados (Freund y Manning, 1989)

a) Como no hay nubes en el cielo, la probabilidad de que lloverá mas tarde en el dia es
de –0.99.
b) La probabilidad de que una muestra de un mineral contendrá cobre es 0.38 y la
probabilidad de que no contendrá cobre es de 0.52.

Ejercicio.
En una bolsa hay 328 bolitas coloradas, 115 amarillas, 32 azules.¿Cuántas deberá sacar de
ésta, sin mirar, para estar seguro de que extraerá dos del mismo color?.

40
Apuntes de Bioestadística
La Paz, Bolivia, 2002 Juan José Vicente Rojas

DISTRIBUCIÓN BINOMIAL

Formula General.
n!
P( x )  p x q n x
x !(n  x)!

Ejercicio.
En la manufactura de cierto tipo de articulo, el 5% se produce con defectos. Determine la
probabilidad que al obtenerse una muestra al azar de 5 artículos, se hallen:

a) un articulo defectuoso
b) todos buenos
c) a lo más dos artículos defectuosos

Solución:

Sea x = Nº artículos defectuosos con probabilidad p


p = 0.05

q = 1 – p = 0.95

a) x = 1

5!
P( x 1)   0.051  0.954
1!(5  1)!

P(x=1) = 0.2036

La probabilidad de obtener un articulo defectuoso en una muestra de 5 artículos es de


20.36%.

b) x = 0, ya que todos los artículos son buenos x = 0, ya que x es el numero de artículos


defectuosos.

5!
P( x 0)   0.050  0.955
0!(5  0)!

P(x=0) = ( 0.95 5) = 0.7737

La probabilidad de hallar todos los artículos buenos en una muestra de 5 piezas es del
77.37%.

41
Apuntes de Bioestadística
La Paz, Bolivia, 2002 Juan José Vicente Rojas

c) a lo más dos artículos defectuosos (x ≤ 2)

P(x ≤ 2) = P(x=0) + P(x=1) +P(x=2)


Los cálculos para P(x=0) y P(x=1), ya los realizamos, faltando el valor de probabilidad de P(x=2):

5!
P( x 2)   0.052  0.953
2!(5  2)!

P(x=2) = 0.0214

Por ultimo:

P(x ≤ 2) = P(x=0) + P(x=1) +P(x=2)

P(x ≤ 2) = 0.7737 + 0.2036 + 0.0214

Ejercicio.
La probabilidad de que un estudiante apruebe un curso de física es 0.7, en una cierta
universidad. Determine la probabilidad, que de cada 10 estudiantes:

a) Todos aprueben
b) Nadie apruebe
c) Por lo menos uno apruebe

Solución.

Sea x = Nº de estudiantes que aprueben con probabilidad p


p = 0.7
q = 1 – p = 0.3, es la probabilidad que un estudiante no apruebe
n = 10

a) Todos aprueben, x = 10
10!
P( x 10)   0.710  0.30
10!(10  10)!

P(x=10) = ( 0.7 10) = 0.0282

La probabilidad que de diez estudiantes elegidos al azar todos aprueben, es 2.82 %.

b) nadie apruebe, x = 0

10!
P( x 0)   0.70  0.310
0!(10  0)!
P(x=0) = ( 0.3 10) = 0.0000059
La probabilidad de que de los diez estudiantes nadie apruebe es muy baja.

42
Apuntes de Bioestadística
La Paz, Bolivia, 2002 Juan José Vicente Rojas

c) Por lo menos uno apruebe, el termino por lo menos nos induce a imaginarnos el
símbolo ≥ lo que indica que el mínimo valor de x es 1; x ≥ 1

P(x ≥ 1) = P(x=1) + P(x=2) + P(x=3) + P(x=4) + P(x=5) + P(x=6) + P(x=7) + P(x=8) + P(x=9) + P(x=10)

Lo que implica un tedioso cálculo que podemos resumirlo de la siguiente forma: Sabemos
que el espacio muestral tiene probabilidad de 1, es decir:

P(x=0) + P(x=1) + P(x=2) + P(x=3) + P(x=4) + P(x=5) + P(x=6) + P(x=7) + P(x=8) + P(x=9) + P(x=10) = 1

Como a nosotros nos interesa las probabilidades desde P(x=1) + P(x=2) + ... + P(x=10) :

P(x=0) + P(x=1) + P(x=2) + P(x=3) + P(x=4) + P(x=5) + P(x=6) + P(x=7) + P(x=8) + P(x=9) + P(x=10) = 1

P(x ≥ 1)

Esto es similar a decir que:

P(x=0) + P(x ≥ 1) = 1

Despejando P(x ≥ 1) :
P(x ≥ 1) = 1 - P(x=0)

Entonces: P(x ≥ 1) = 1 - 0.0000059 = 0.99999941

La probabilidad que de los diez estudiantes por lo menos uno apruebe es 99.99 %.

Ejercicio.
Supóngase que el nacimiento de 1 niño tiene probabilidad de 1/2 ; halle la probabilidad de
que una familia con 4 hijos ( en término hijos considere hombres y mujeres) tenga:

a) Exactamente un niño
b) A lo mucho 1 niño

Solución:

Datos
Sea x = Nº de niños con probabilidad p.
p=½
q=1–p=½
n=4
a) Exactamente un niño ( x = 1)

4!
P( x 1)  1/ 21 1/ 23
1!(4  1)!

P(x=1) = 0.25

43
Apuntes de Bioestadística
La Paz, Bolivia, 2002 Juan José Vicente Rojas

b) A lo mucho un niño ( X ≤ 1)

P(x≤1) = P(x=0) + P(x=1)

De la anterior expresión el valor de probabilidad que nos falta calcular es P(x=0):

4!
P( x 0)  1/ 20 1/ 24
0!(4  0)!

P(x=0) = (1/2)4 = 0.0625

Finalmente:

P(x≤1) = P(x=0) + P(x=1)


P(x≤1) = 0.0625 + 0.25
P(x≤1) = 0.3125

44
Apuntes de Bioestadística
La Paz, Bolivia, 2002 Juan José Vicente Rojas

DISTRIBUCION NORMAL

Las variables aleatorias continuas se presentan cuando se manejan cantidades que se


miden en una escala continua; por ejemplo, cuando se mide la cantidad de sangre de una
persona, el peso neto de un paquete de alimento congelado, la velocidad de un automóvil,
etc. En el caso continuo el lugar de los histogramas lo toman curvas continuas, entre las
curvas de distribución continua que se emplean en estadística la mas importante es la curva
normal, que es un tipo especial de curva en forma de campana dada por una ecuación
matemática, (Freund y Manning, 1989).

La anterior descripción puede entenderse mejor con el siguiente histograma que representa
el peso de semilla por vaina de cierta variedad de frijol, donde se traza una curva normal
sobre el histograma de frecuencias, muchas de las variables que se estudian en Agronomía
se distribuyen de forma continua, para su estudio se asume que estas variables se
distribuyen como una curva normal, es decir asumimos que la distribución de la variable se
aproxima a una curva normal.

20
Frequencia

10

4.0 4.5 5.0 5.5 6.0 6.5 7.0 7.5 8.0 8.5

Gramos

Características.

- El área total limitada bajo la curva normal y el eje de las abscisas es igual a uno
- El área entre dos ordenadas de la curva , para x=a y x=b, donde a < b, representa la
probabilidad de que X se halle entre a y b, y se denota como P(a<x<b).
- La curva puede extenderse desde – ∞ hasta ∞.

45
Apuntes de Bioestadística
La Paz, Bolivia, 2002 Juan José Vicente Rojas

La Distribución Normal Estándar.

Si asumiríamos que una variable se distribuye normalmente podríamos hallar las áreas bajo
la curva desarrollando la ecuación que define a esta curva; conociendo μ y σ, para evitar
este tedio los estadísticos desarrollaron tablas especiales para hallar las áreas situadas
debajo de curvas normales, las cuales están tabuladas en relación a una distribución normal
con media μ=0 y σ = 1; la cual se llama distribución normal estándar o tipificada. Para esto
debemos cambiar la escala de la variable original con la formula:

x
z

Donde el valor de z indica cuantas desviaciones estándar esta el valor de x arriba o debajo
de la media, en otras palabras, a cuantos desvíos estándar corresponde el desvió de dicho
valor con respecto a su media. El aplicar esta formula a una variable se conoce como
estandarización.

Características.

- La curva es simétrica, siendo „y‟ el eje de simetría


- La altura máxima se alcanza en el punto (0, 1/√2π), donde 1/√2π ≈ 0.4
- La curva tiene puntos de inflexión en z=1 y z= -1
- Se extiende desde – ∞ hasta ∞.

46
Apuntes de Bioestadística
La Paz, Bolivia, 2002 Juan José Vicente Rojas

Calculo de probabilidades empleando la distribución normal estándar.

Hay que mencionar que existen diferentes tablas para calcular áreas con la curva normal
estándar que difieren en su manejo aunque los resultados deben ser los mismos, con la
Tabla Nº 1 del anexo, calcular:

P (0 < z < 1.55): la probabilidad de que el valor de z se halle entre 0 y 1.55, gráficamente
podría representarse de la siguiente forma donde ? representara el área pedida :

Para hallar este tipo de áreas (desde cero a cualquier valor), la tabla que manejamos nos la
da directamente, buscando el valor en la tabla:

Z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
0.0 0.0000 0.0040 0.0080 0.0120 0.0160 0.0199 0.0239 0.0279 0.0319 0.0359
0.1 0.0398 0.0438 0.0478 0.0517 0.0557 0.0596 0.0636 0.0675 0.0714 0.0753
0.2 0.0793 0.0832 0.0871 0.0910 0.0948 0.0987 0.1026 0.1064 0.1103 0.1141
. . . . . . . . . . .
. . . . . . . . . . .
1.4 0.4192 0.4207 0.4222 0.4236 0.4251 0.4265 0.4279 0.4292 0.4306 0.4319
1.5 0.4332 0.4345 0.4357 0.4370 0.4382 0.4394 0.4406 0.4418 0.4429 0.4441
1.6 0.4452 0.4463 0.4474 0.4484 0.4495 0.4505 0.4515 0.4525 0.4535 0.4545

P (0 < z < 1.55) = 0.4394

P ( z > 1.55), este es un caso inverso gráficamente se podría representar asi:

47
Apuntes de Bioestadística
La Paz, Bolivia, 2002 Juan José Vicente Rojas

Si nosotros buscamos directamente en la tabla el área para 1.55 obtendríamos 0.4394, que
como vimos es el área de 0 a 1.55, lo cual en esta situación seria incorrecto, para este caso
sabemos que cada lado de la curva tiene área de 0.5, luego por una sustracción de áreas
podríamos calcular el valor de P ( z > 1.55), gráficamente :

Por lo tanto:
P ( z > 1.55) = 0.5 – 0.4394 = 0.0606
P ( z > 1.55) = 0.0606

NOTAR QUE LO QUE SE RESTA SON ÁREAS o PROBABILIDADES (NO VALORES Z)

P(z < -1.55): La probabilidad de que z sea menor a –1.55, gráficamente:

Como la curva es simétrica el área buscada es:

48
Apuntes de Bioestadística
La Paz, Bolivia, 2002 Juan José Vicente Rojas

Que como vimos anteriormente es 0.0606 por lo tanto la respuesta es :


P(z < -1.55) = 0.0606

OJO: No existen probabilidades negativas, lo que si puede ser negativo es el valor de z en el


eje.

P( -1.43 < z < 0): La probabilidad de que z se halle entre –1.43 y 0, gráficamente podría ser:

Empleando la propiedad de simetría:

El área para un valor de z negativo como el que buscamos es igual al área del valor z
positivo, como se ve en la anterior figura, que como recordamos, se obtiene directamente de
la tabla, la respuesta es:

P( -1.43 < z < 0) = 0.4236

P(-1.34 < z < 1.45):

49
Apuntes de Bioestadística
La Paz, Bolivia, 2002 Juan José Vicente Rojas

Lo que podemos obtener sumando las dos áreas que nos proporciona la tabla:

0.4099 + 0.4265

Respuesta:
P(-1.34 < z < 1.45) = 0.8364

P(z < 1.39):

Sabemos que el área por debajo de 0 es 0.5, de modo que debemos calcular el área desde 0
a 1.39 y sumarle la mitad de la curva (0.5) al área encontrada, es decir

El área para 1.39 en la tabla es 0.4177, de modo que


P(z < 1.39) = 0.5 + 0.4177
P(z < 1.39) = 0.9177

50
Apuntes de Bioestadística
La Paz, Bolivia, 2002 Juan José Vicente Rojas

P(0.4 < z < 2.8): la probabilidad que el valor z se halle entre 0.4 y 2.8, gráficamente podría
representarse:

Dado que la curva es simétrica y cada lado tiene área de 0.5 (ó 50 %) podemos calcular el
área de esta forma:

En términos de área debemos hallar:

P (0.4 < z < 2.8) = P (0< z < 2.8) – P(0 < z < 0.4)

Buscando en la tabla:
P (0.4 < z < 2.8) = 0.4974 – 0.1554
P (0.4 < z < 2.8) = 0.3420

51
Apuntes de Bioestadística
La Paz, Bolivia, 2002 Juan José Vicente Rojas

Ejercicios de aplicación ( Acá se supone que ya dominas el manejo de la tabla):

Ejercicio.
El peso promedio por huevo de gallina, de todos los producidos durante un mes en una
cierta granja, es de 50 gramos y la desviación estándar es de 8 gramos. Si se supone que
los pesos se distribuyen normalmente.

a) Determine el porcentaje de huevos que tendrán sus pesos entre 55 y 65 gramos.


b) Determine el porcentaje de huevos con pesos entre 40 y 65 gramos
c) Porcentaje de huevos con pesos menores a 45 gramos

Datos
μ = 50 gr
σ=8

a) El porcentaje de huevos entre 55 y 65 se puede graficar :

Estandarizando para los valores de 55 y 65:

55  50 65  50
z1   0.62 z2   1.87
8 8
Obteniendo luego la siguiente distribución estandarizada:

El área se calcula por diferencia como se vio en un caso anterior

P(0.62 < z < 1.87) = P(0 < z< 1.87) – P(0 < z < 0.62)
P(0.62 < z < 1.87) = 0.4693 – 0.2324
P(0.62 < z < 1.87) = 0.2369
Respuesta: El porcentaje de huevos que se producen con pesos entre 55 y 65 gramos es
23.69%

52
Apuntes de Bioestadística
La Paz, Bolivia, 2002 Juan José Vicente Rojas

b) Porcentaje de huevos con pesos entre 40 y 65 gramos

Estandarizando:

40  50 65  50
z1    1.25 z2   1.87
8 8

Con lo que la distribución es :

Lo que se puede calcular con la suma de las dos áreas:

P(-1.25 < z < 1.87) = P(0 < z < 1.25) + P(0 < z < 1.87)
P(-1.25 < z < 1.87) = 0.3944 + 0.4693
P(-1.25 < z < 1.87) = 0.8637

Respuesta: EL porcentaje de huevos con pesos entre 40 y 65 es de 86.37%

53
Apuntes de Bioestadística
La Paz, Bolivia, 2002 Juan José Vicente Rojas

c) Porcentaje de huevos con pesos menores a 45 gramos

Estandarizando:

45  50
z   0.62
8

Que como se vio anteriormente se calcula restando a 0.5 el área que corresponde en la tabla
al valor positivo de z de 0.62:

P(z < - 0.62) = 0.5 – P(0 < z < 0.62)


P(z < - 0.62) = 0.5 – 0.2324
P(z < - 0.62) = 0.2676

Respuesta: El porcentaje de huevos con pesos menores a 45 gramos es 26.76%.

54
Apuntes de Bioestadística
La Paz, Bolivia, 2002 Juan José Vicente Rojas

Ejercicio.
La lluvia estacional media de un cierto pueblo es de 18.75 pulgadas, con una desviación
estándar de 6.5 pulgadas. Se supone que la lluvia estacional tiene una distribución normal.
¿En cuantos años de un periodo de 50, se podrá esperar una lluvia de 15 a 25
pulgadas?(Martínez, 1997).

Datos
μ = 50 gr
σ=8

Estandarizando:

15  18.75 25  18.75
z1    0.58 z2   0.96
6.5 6.5
Por lo que el área pedida es:

El área total se obtiene sumando las probabilidades que nos da la tabla para los dos valores
de z:
P(-0.58 < z < 0.96) = P(0 < z < 0.58) + P(0 < z < 0.96)
P(-0.58 < z < 0.96) = 0.2190 + 0.3315
P(-0.58 < z < 0.96) = 0.5505 ó 55%

Para de un total de 50 años, en cuantos habrá lluvias de 15 a 25 pulgadas, se multiplica la


probabilidad por el numero de años:
50*0.5505 = 27.52 años
Respuesta:
De un total de 50 años, aproximadamente en 28 de ellos se espera que habrá lluvias de 15 a
25 pulgadas

55
Apuntes de Bioestadística
La Paz, Bolivia, 2002 Juan José Vicente Rojas

Ejercicio
La media del peso de 500 estudiantes de un cierto colegio es de 151 libras y la desviación
típica es de 15 libras, Suponiendo que los pesos se distribuyen normalmente, a) Que
porcentaje de estudiantes pesaran mas de 185 libras b) Cuantos alumnos representa este
porcentaje?.

Datos
μ = 151
σ = 15
N = 500

Gráficamente:

a) Estandarizando:
185  151
z  2.26
15
Con lo que el área pedida es:

Lo que se calcula quitando a 0.5 el área desde 0 a 2.26:

P(z > 2.26) = 0.5 – P(0 < z < 2.26)


P(z > 2.26) = 0.5 – 0.4881
P(z > 2.26) = 0.0119 ó 1.19%

b) 0.0119 * 500 = 5.95 ≈ 6 estudiantes

56
Apuntes de Bioestadística
La Paz, Bolivia, 2002 Juan José Vicente Rojas

Ejercicio
El peso al destete de los lechones de una granja es de 20 kg con desviación típica de 2.5 kg,
si los pesos se distribuyen normalmente. a)¿Cuál es la probabilidad que los lechones se
desteten con pesos menores a 12 kg?.b) Si la población anual de lechones vivos es de 200,
cuantos lechones se espera desteten con este peso?

Datos
μ = 151 kg, σ = 15 kg, N = 200

a) Gráficamente:

:
Estandarizando
12  20
z   3.2
2.5

Con lo que el área pedida queda:

Lo que calculamos restando a 0.5 el área correspondiente de 0 al valor positivo de 3.2:

P(z<-3.2) = 0.5 – P(0 < z < 3.2) ; sabemos que P(-3.2 < z < 0) = P(0 < z < 3.2) por simetría
P(z<-3.2) = 0.5 – 0.4993
P(z<-3.2) = 0.0007
La probabilidad de que los lechones se desteten con pesos menores a 12 kg es muy
pequeña 0.07%

b) 0.0007 * 200 = 0.14 lechones, al ser la probabilidad de destete con este peso (<12 kg)
muy baja, prácticamente no se desteta ningún lechón con este peso, para este tamaño de
población.

57
Apuntes de Bioestadística
La Paz, Bolivia, 2002 Juan José Vicente Rojas

Pruebas de Hipótesis.

Hipótesis estadística.
Es un supuesto de sobre las distribuciones de probabilidad de las poblaciones
(Spiegel, 1988), es una suposición hecha con respecto a la función de distribución de una
variable aleatoria (Caballero, 1975). Es una suposición sobre la población.

Hipótesis nula. Es la que generalmente plantea una igualdad, ejemplo; μ1 = μ2, μ = 15

Hipótesis alterna. Plantea algo diferente a la hipótesis nula, ejemplo; μ1 ≠ μ2, μ1 < μ2, μ1 > μ2.

Error tipo I. Rechazar una Hipótesis nula cuando debería ser aceptada.

Error tipo II (Beta). Aceptar una Hipótesis nula cuando debería ser rechazada.

Nivel de significación. Es la probabilidad máxima con la que en el ensayo de una hipótesis


se puede cometer un error del tipo I, se denota por α, se fija antes de la extracción de las
muestras (Spiegel,1988).

Signos en la Hipótesis alterna. De acuerdo al signo de la Hipótesis alterna, se determina la


región critica, los valores tabulares dependen del nivel de significación.

Regiones criticas al 5% y 1% para pruebas de dos colas

58
Apuntes de Bioestadística
La Paz, Bolivia, 2002 Juan José Vicente Rojas

Regiones criticas al 5% para pruebas de 1 cola (puede ser derecha o izquierda)

Regiones criticas al 1% para pruebas de 1 cola (puede ser derecha o izquierda)

Estadístico de prueba.

x
zc 

n

Donde σ/√n es el error estándar de la media

59
Apuntes de Bioestadística
La Paz, Bolivia, 2002 Juan José Vicente Rojas

Ejercicio.
La duración media de una muestra de 100 tubos fluorescentes producidos por una
compañía resulta ser de 1570 horas, con un desviación típica de 120 horas, Si μ es la
duración media de todos los tubos producidos por la compañía, comprobar la hipótesis
μ = 1600 horas contra la hipótesis alternativa μ ≠ 1600 con un nivel de significación de 0.05
(Spiegel, 1988).
Datos

μ = 1600 horas
x = 1570 horas
σ = 120 horas
n = 100
α = 0.05

1) Planteo de Hipótesis

Ho : μ = 1600 horas
Ha : μ ≠ 1600

2) Determinación de la región critica o valor crítico, por el signo la prueba es de 2 colas al


nivel de 5%.

3) Cálculo del estadístico de prueba

x 1570  1600


zc  zc 
 120
n 100
zc = -2.5

4) Decisión

Como zc (-2.5) cae en la zona de rechazo de Ho; No aceptamos la Hipótesis nula

5) Conclusión.

La duración media de los tubos fluorescentes es diferente de 1600 horas

60
Apuntes de Bioestadística
La Paz, Bolivia, 2002 Juan José Vicente Rojas

Ejercicio.
Una fabrica productora de café instantáneo indica en las etiquetas de sus envases que el
contenido neto de cada lata es de 250 gramos. Una muestra al azar, realizada en 60
pulperías de un pueblo, tuvo una media de 246 gramos y una desviación estándar de 12
gramos.¿Pueden las autoridades del pueblo, al nivel del 5 %, denunciar que la compañía
esta incumpliendo con su afirmación? (Caballero,1975).

Datos
μ = 250 gramos
x = 246 gramos
σ = 12 gramos
n = 60
α = 0.05

1) Planteo de Hipótesis

Ho : μ = 250 gramos
Ha : μ < 250 gramos “La compañía no cumple su afirmación”

2) Determinación de la región critica o valor crítico, por el signo la prueba es de cola


izquierda al nivel de 5%.

3) Cálculo del estadístico de prueba

x 246  250


zc  zc 
 12
n 60
zc = -2.58

4) Decisión

Como zc (-2.58) cae en la zona de rechazo de Ho; No aceptamos la Hipótesis nula

5) Conclusión.
Las autoridades del pueblo pueden denunciar a la compañía por incumplir su afirmación.

61
Apuntes de Bioestadística
La Paz, Bolivia, 2002 Juan José Vicente Rojas

Ejercicio
Una fabrica de automóviles de tipo A declara que sus vehículos rinden 30 km/galón de
gasolina, un distribuidor de esta fabrica al probar 36 vehículos del tipo A determinó un
rendimiento medio de 28 km/galon con desviación estándar de 5 km/galón. ¿Qué conclusión
puede definirse al 5% de significación? (Caballero,1975).

Datos
μ = 30 km/galón
x = 28 km/galón
σ = 5 km/galón
n = 36
α = 0.05

1) Planteo de Hipótesis
Ho : μ = 30 km/galón
Ha : μ ≠ 30 km/galón “La fabrica no cumple su declaración”

2) Determinación de la región critica o valor crítico, por el signo la prueba es de dos colas al
nivel de 5%.

3) Cálculo del estadístico de prueba

x 28  30
zc  zc 
 5
n 36
zc = -2.4

4) Decisión

Como zc (-2.4) cae en la zona de rechazo de Ho; No aceptamos la Hipótesis nula

5) Conclusión.

La fabrica no cumple su afirmación, el rendimiento de automóviles de tipo A, es diferente de


36 km/galón.

62
Apuntes de Bioestadística
La Paz, Bolivia, 2002 Juan José Vicente Rojas

Ejercicio.
Una compañía que vende semilla certificada declara que el porcentaje de germinación es de
80%. Un agricultor determinó en un ensayo, que solo 650 semillas germinaron de 900
utilizadas. ¿Puede servir este porcentaje para afirmar que es menor el porcentaje de
germinación al nivel de significación del 1%?.

Datos
p = 0.8 (80% de germinación)
q = (1-p) = 0.2
n = 900
Cálculos: La media de una variable binomial;
μ = n*p

μ = 900*0.8 = 720 semillas que debieron haber germinado según la información


proporcionada por la compañía

1) Planteo de Hipótesis
Ho : ρ = 0.8 “y la afirmación de la compañía es correcta”
Ha : ρ < 0.8 “y la afirmación de la compañía no es cierta”

2) Determinación de la región critica o valor crítico, por el signo la prueba es de dos colas al
nivel de 5%.

3) Cálculo del estadístico de prueba


x  n* p 650  720
zc  zc 
n* p*q 900 * 0.8 * 0.2

En este caso el estadístico es diferente al empleado anteriormente considerando que la


variable es binomial (la semilla germina o no germina) y el tamaño de muestra relativamente
grande se emplea la distribución normal como aproximación de la binomial.

zc = -5.83

4) Decisión
Como zc (-5.83) cae en la zona de rechazo de Ho; No aceptamos la Hipótesis nula

5) Conclusión.

En base a la muestra se concluye que la afirmación de la compañía no es correcta, el


porcentaje de germinación es menor al 80%.

63
Apuntes de Bioestadística
La Paz, Bolivia, 2002 Juan José Vicente Rojas

DISTRIBUCIÓN DE t

Se emplea cuando la muestra es pequeña (n ≤ 30) no se conoce σ pero conocemos S o S2.

Manejo de la tabla.

Buscar el valor tabular de t con 8 gl y = 0.05, para una prueba de dos colas:

Gráficamente:

Buscando en la tabla de la siguiente forma:

Probabilidad de un valor más alto de t (2 colas)


gl 0.5 0.4 0.3 0.2 0.10 0.05 0.02 0.01 0.001
1 1.000 1.376 1.963 3.078 6.314 12.706 31.821 63.656 636.578
2 0.816 1.061 1.386 1.886 2.920 4.303 6.965 9.925 31.600
3 0.765 0.978 1.250 1.638 2.353 3.182 4.541 5.841 12.924
4 0.741 0.941 1.190 1.533 2.132 2.776 3.747 4.604 8.610
5 0.727 0.920 1.156 1.476 2.015 2.571 3.365 4.032 6.869
6 0.718 0.906 1.134 1.440 1.943 2.447 3.143 3.707 5.959
7 0.711 0.896 1.119 1.415 1.895 2.365 2.998 3.499 5.408
8 0.706 0.889 1.108 1.397 1.860 2.306 2.896 3.355 5.041
9 0.703 0.883 1.100 1.383 1.833 2.262 2.821 3.250 4.781

Y tenemos:

El valor critico de dos colas para 8 gl al 5% de riesgo es 2.306

64
Apuntes de Bioestadística
La Paz, Bolivia, 2002 Juan José Vicente Rojas

Buscar el valor tabular de cola derecha de t para 10 gl al 5% de riesgo, en la tabla se ingresa


por abajo (1cola):

9 0.703 0.883 1.100 1.383 1.833 2.262 2.821 3.250 4.781


10 0.700 0.879 1.093 1.372 1.812 2.228 2.764 3.169 4.587
11 0.697 0.876 1.088 1.363 1.796 2.201 2.718 3.106 4.437
12 0.695 0.873 1.083 1.356 1.782 2.179 2.681 3.055 4.318
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .

60 0.679 0.848 1.045 1.296 1.671 2.000 2.390 2.660 3.460


120 0.677 0.845 1.041 1.289 1.658 1.980 2.358 2.617 3.373
Inf 0.674 0.842 1.036 1.282 1.645 1.960 2.336 2.576 3.291
gl 0.25 0.2 0.15 0.1 0.05 0.025 0.01 0.005 0.0005
Probabilidad de un valor positivo más alto de t (1 cola)

Y tenemos:

Buscar el valor tabular de cola izquierda para 10 gl y al nivel del 5%, esta es una situación
inversa del anterior ejemplo, el valor tabular toma un valor negativo al situarse a la izquierda
de la distribución.

65
Apuntes de Bioestadística
La Paz, Bolivia, 2002 Juan José Vicente Rojas

a) Distribución de la media.

Estadístico de prueba:

x
tc 
s
n

Ejemplo.
Una variedad de cebada, usada por varios años en una región rindió en promedio 1500
kg/ha. Una nueva variedad lograda en el medio se cultivo en 16 parcelas seleccionadas al
azar y tuvo rendimiento medio de 1650 kg/ha y desvió estándar de 200 kg/ha ¿Qué
conclusiones se tiene de este experimento?.

Datos:

μ = 1500 kg/ha
x = 1650 kg/ha
S = 200 kg/ha
n = 16
α = 0.05

1) Planteo de Hipótesis

Ho : μ = 1500 kg/ha
Ha : μ > 1500 kg/ha

2) Determinación dela región critica o valor crítico, por el signo la prueba es de cola derecha

t tab n – 1 = 15 gl
α = 0.05
1 cola (derecha)

t tab = 1.753

66
Apuntes de Bioestadística
La Paz, Bolivia, 2002 Juan José Vicente Rojas

3) Cálculo del estadístico de prueba

1650  1500
tc 
200
16

tc = 3.0

4) Decisión

Como tc (3.0) cae en la zona de rechazo de Ho; descartamos la Hipótesis nula

5) Conclusión.

La nueva variedad de cebada tiene un rendimiento mayor a la variedad empleada


tradicionalmente en la zona.

Ejemplo.

Una muestra de 16 observaciones tiene media 28 y desviación estándar de 3. Usando el


nivel de significancia del 5%. ¿Hay razón para rechazar la Hipótesis que la media de la
población es de 30?.

Datos
μ = 30
x = 28
S=3
n = 16
α = 0.05

1) Planteo de Hipótesis
Ho : μ = 30
Ha : μ ≠ 30
2) Determinación de la región critica o valor crítico
t tab n – 1 = 15 gl
α = 0.05
2 colas
t tab = 2.131

67
Apuntes de Bioestadística
La Paz, Bolivia, 2002 Juan José Vicente Rojas

3) Cálculo del estadístico de prueba

30  28
tc 
3
16

tc = - 2.66

4) Decisión

Como tc cae en la zona de rechazo de Ho; existe suficiente evidencia para no aceptar la Ho.
Nuestra decisión es no aceptar la Ho.

5) Conclusión.

Existen suficiente evidencia para afirmar que la media de la población es diferente de 30

Ejemplo.

Un ensayo sobre resistencia a la rotura de 6 cuerdas fabricadas por una compañía mostró
una resistencia media de 7750 lb y una desviación típica de 145, mientras que el fabricante
sostenía que la resistencia media de sus cuerdas era de 8000 lb.¿Se puede admitir la
afirmación del fabricante al nivel de significación del 5%? (Spiegel,1988)

Datos
μ = 8000 lb
x = 7750
S = 145
n=6
α = 0.05
1) Planteo de Hipótesis
Ho : μ = 8000, y la afirmación del fabricante esta justificada
Ha : μ < 8000, y la afirmación del fabricante es falsa
2) Determinación de la región critica o valor crítico
t tab n – 1 = 5 gl
α = 0.05
1 cola (Izquierda)
t tab = 2.015

68
Apuntes de Bioestadística
La Paz, Bolivia, 2002 Juan José Vicente Rojas

3) Cálculo del estadístico de prueba

7750  8000
tc 
145
6

tc = - 4.22

4) Decisión

Como tc cae en la zona de Rechazo de Ho; existe suficiente evidencia para no aceptar la Ho.

5) Conclusión.

La afirmación del fabricante sobre la resistencia de las cuerdas a la rotura no es justificada

b) Distribución acerca de la diferencia entre medias.

Estadístico de prueba

x1  x2
tc 
Sc 2 Sc 2

n1 n2

Donde: Sc2 = Varianza ponderada o agrupada

(n1  1) S12  (n2  1) S 22


Sc 
2

n1  n2  2

Esta prueba asume que las observaciones se distribuyen normalmente y que las varianzas
de las dos poblaciones estudiadas son similares, lo que se puede determinar con la prueba
de F. En caso de no existir homogeneidad de varianzas, existen alternativas de esta prueba
para tales casos.

69
Apuntes de Bioestadística
La Paz, Bolivia, 2002 Juan José Vicente Rojas

Ejemplo.
Pruebas del control de calidad para dos procesos de manufactura dan los siguientes
resultados (Caballero, 1975):

Proceso 1 5 15 25 15
Proceso 2 15 20 20 20 30 25

¿Permiten estos resultados afirmar que los procesos rinden diferentes calidades?

Antes de resolver el ejercicio se necesita las medias y desvíos estándares de ambos


procesos:
Proceso 1: n = 4, Media = 15, S1 = 8.16
Proceso 2: n = 6, Media = 21.67, S2 = 5.16

1) Planteo de Hipótesis

Ho : μ1 = μ2, ambos procesos son similares en calidad


Ha : μ1 ≠ μ2, ambos procesos no son similares en calidad

2) Determinación de la región critica o valor crítico

t tab: n1 + n2 – 2 = 4 + 6 – 2 = 8 gl
α = 0.05
2 colas

t tab = 2.306

70
Apuntes de Bioestadística
La Paz, Bolivia, 2002 Juan José Vicente Rojas

3) Cálculo del estadístico de prueba

Primeramente calculamos la varianza agrupada:

(4  1)8.16 2  (6  1)5.16 2
Sc  2

4 6 2
2
Sc = 41.61, valor que reemplazamos en tc:

15  21.67
tc 
41.61 41.61

4 6

tc = - 1.60

4) Decisión

Como tc cae en la zona de Aceptación de Ho; No existe suficiente evidencia para rechazar la
Ho con un riesgo del 5%.

5) Conclusión.

No existe suficiente evidencia para afirmar que los dos procesos rinden diferentes calidades.
Los dos proceso tienen calidades similares.

Ejemplo.
En una estación agrícola se deseaba ensayar el efecto de un determinado fertilizante sobre
la producción de trigo. Para ello se eligieron 24 parcelas de terreno de igual superficie; la
mitad de ellas fueron tratadas con el fertilizante y la otra mitad no (grupo testigo). Todas las
demás condiciones fueron las mismas. La media de trigo conseguida en las parcelas no
tratadas fue de 4.8 fanegas con desviación típica de 0.40 fanegas, mientras que la media en
las parcelas tratadas fue de 5.1 fanegas, con desviación típica de 0.36 fanegas. ¿Puede
deducirse que hay un incremento en la producción de trigo por el empleo del fertilizante al
nivel de significación de 1%? (Spiegel, 1988).

Datos: μ1 y μ2 son las producciones poblacionales medias en los suelos tratados y no


tratados respectivamente:

Con fertilizante: n1 = 12, Media = 5.1 fanegas, S1 = 0.36 fanegas


Sin fertilizante: n2 = 12, Media = 4.8 fanegas, S2 = 0.4 fanegas

1) Planteo de Hipótesis

Ho : μ1 = μ2, La diferencia se debe al azar


Ha : μ1 > μ2, El fertilizante incrementa la producción

71
Apuntes de Bioestadística
La Paz, Bolivia, 2002 Juan José Vicente Rojas

2) Determinación de la región critica o valor crítico

t tab: n1 + n2 – 2 = 12 + 12 – 2 = 22 gl
α = 0.01
1 cola (Derecha)

t tab = 2.508

3) Cálculo del estadístico de prueba

Primeramente calculamos la varianza agrupada:

(12  1)0.362  (12  1)0.42


Sc 2 
12  12  2

Sc2= 0.145, valor que reemplazamos en tc:

5.1  4.8
tc 
0.145 0.145

12 12

tc = 1.92

4) Decisión

tc cae en la zona de Aceptación de Ho con un riesgo del 1%.

5) Conclusión.

El incremento en la producción de trigo al utilizar el fertilizante no es significativo, es


necesario realizar mas pruebas.

72
Apuntes de Bioestadística
La Paz, Bolivia, 2002 Juan José Vicente Rojas

Ejemplo.

Con 10 automóviles de una misma fabrica y con iguales características se trató de probar la
calidad de dos tipos de gasolina, con la gasolina de tipo A, cinco de los vehículos escogidos
al azar rindieron 30 km/galón en promedio y una desviación estándar de 2.6 km/galón. Con
la gasolina de tipo B, los otros cinco vehículos rindieron 27 km/galón y desvío estándar de
3.4 km/galón. ¿Es posible señalar que la gasolina de tipo A es mejor que la de tipo B con 5%
de riesgo?.

Datos
Gasolina Tipo A: n1 = 5, Media = 30 km/gal, S1 = 2.6 km/gal
Gasolina Tipo B: n2 = 5, Media = 27 km/gal, S2 = 3.4 km/gal

1) Planteo de Hipótesis

Ho : μA = μB, Ambas gasolinas tiene similares rendimientos


Ha : μA > μB, La gasolina de tipo A es mejor de la de tipo B

2) Determinación de la región critica o valor crítico

t tab: n1 + n2 – 2 = 5 + 5 – 2 = 8 gl
α = 0.05
1 cola (Derecha)

t tab = 1.860

3) Cálculo del estadístico de prueba

Primeramente calculamos la varianza agrupada:

(5  1)2.62  (5  1)3.42
Sc 2 
5 5 2

73
Apuntes de Bioestadística
La Paz, Bolivia, 2002 Juan José Vicente Rojas

Sc2 = 9.16, valor que reemplazamos en tc:

30  27
tc 
9.16 9.16

5 5

tc = 1.56

4) Decisión

tc cae en la zona de Aceptación de Ho con un riesgo del 5%.

5) Conclusión.

No existe evidencia para afirmar que la gasolina de tipo A es mejor que la gasolina de tipo B.
La gasolina tipo A no es mejor que la gasolina de tipo B.

Ejemplo.

De un experimento de maíz se tienen los siguientes resultados en los que T indica parcelas
sin abonamiento y A indica parcelas abonadas.

A : n1 = 25, Media = 75, ∑ (A – A)2 = 1482


T : n2 = 16, Media = 60, ∑ (T – T)2 = 1832

Pruebe si existen diferencias al nivel del 1% (Caballero, 1975)

Sabemos que la varianza es:

S 2

(x i  x) 2
n 1

De donde despejamos la Suma de cuadrados:

 (x i - x) 2  S 2 * (n  1)

Que es la información que se nos proporciona: ∑ (A – A)2, ∑ (T – T)2 y que se sustituye


directamente en la varianza ponderada (Sc2)

1 Hipótesis)

Ho : μA = μT El abonamiento no incrementa el rendimiento de maíz


Ha : μA > μT El abonamiento incrementa el rendimiento de maíz

74
Apuntes de Bioestadística
La Paz, Bolivia, 2002 Juan José Vicente Rojas

2) Determinación de la región critica o valor crítico

t tab n1 + n2 – 2 = 25 + 16 – 2 = 39 gl
α = 0.01
1 cola (Derecha)

t tab = 2.426 (obtenido por interpolación) de 38 gl, 2.429 y 40 gl, 2.423, de todas formas no se
comete gran error asumiendo como gl el valor de 2.423 por la magnitud de la muestra
conjunta.

3) Cálculo del estadístico de prueba

Primeramente calculamos la varianza agrupada:

1482  1832
Sc 2 
25  16  2

Sc2 = 84.97, valor que reemplazamos en tc:

70  60
tc 
84.97 84.97

25 16
tc = 5.08

4) Decisión

tc cae en la zona de Rechazo de Ho con un riesgo del 5%.

5) Conclusión.

Existen diferencias estadísticas entre los rendimientos de maíz de parcelas abonadas (A) y
sin abonar (T), el abonamiento incrementa el rendimiento de maíz muy significativamente.

75
Apuntes de Bioestadística
La Paz, Bolivia, 2002 Juan José Vicente Rojas

DISTRIBUCIÓN DE CHI CUADRADA (Χ2)

Manejo de la tabla.

La tabla 3 de los anexos solo da valores de Chi2 para colas derechas

Ejemplo.
Buscar el valor de Chi tabular para 5 gl y α = 0.05:

En la tabla:

Valores críticos de la distribución ji-cuadrada (cola superior)


Alpha
gl 0.995 0.99 0.975 0.95 0.90 0.10 0.05 0.025 0.01 0.005
1 3.93E-05 0.00016 0.000982 0.00393 0.0158 2.706 3.84 5.02 6.63 7.88
2 0.010 0.0201 0.0506 0.103 0.211 4.61 5.99 7.38 9.21 10.60
. . . . . . . . . . .
5 0.412 0.554 0.831 1.145 1.610 9.24 11.07 12.83 15.09 16.75
6 0.676 0.872 1.237 1.64 2.20 10.64 12.59 14.45 16.81 18.55

Chi tabular = 11.07

Ejemplo.
Buscar el valor de Chi tabular para 5 gl y α = 0.05 para cola izquierda:

Gráficamente:

Como la tabla da valores de


probabilidad de cola derecha para
hallar el valor que deje por debajo
de él 5% de area, nosotros
deberemos buscar en la tabla el
valor con 5 gl y 1 – α:

Chi tabular con 5 gl y 0.95 = 1.145

76
Apuntes de Bioestadística
La Paz, Bolivia, 2002 Juan José Vicente Rojas

Ejemplo.
Buscar el valor de Chi tabular para 5 gl y α = 0.05 para dos colas:
Gráficamente:

Por lo que tenemos que


buscar 2 valores tabulares:

Uno en la cola derecha para


α/2 = 0.025, en la tabla este
valor que se busca
2
directamente es Chi = 12.83 y
2
corresponde al valor de Chi
para la cola derecha.

El otro valor lo buscamos


primero restando de 1 el valor
de α/2;

1 - α/2 =
1 – 0.025 = 0.975

ahora buscamos en la tabla el


2
valor para Chi para 5 gl y
probabilidad de 0.975:
2
Chi = 0.831 que es el valor en
la cola izquierda

Finalmente tenemos:

77
Apuntes de Bioestadística
La Paz, Bolivia, 2002 Juan José Vicente Rojas

Prueba de Frecuencias observadas.

Estadístico de prueba.

 
2 o  e2
c
e
Donde:

o = Frecuencias observadas
e = Frecuencias esperadas

Ejemplo.

En un experimento mendeliano con arvejas se obtuvo 13 flores rojas, 42 rosadas y 25


blancas. De acuerdo a la teoría deben tenerse una proporción de 1 roja: 2 rosadas: 1 blanca.
¿Se ajustan los resultados a la teoría al 1%?

Datos

N = 13 + 42 + 25 = 80
Relación esperada 1 : 2 : 1
O también 1/4 2/4 1/4

Antes de resolver el ejercicio realicemos algunos cálculos:

La frecuencia esperada de flores rojas es en proporción ¼, es decir que de las 80 plantas


totales ¼ de estas deberían ser rojas:

Flores rojas esperadas : ¼*80 = 20

La frecuencia esperada de flores rosadas es en proporción 2/4 o 1/2, es decir que de las 80
plantas totales ½ de estas deberían ser rosadas:

Flores rosadas esperadas : ½*80 = 40

La frecuencia esperada de flores blancas es en proporción ¼, es decir que de las 80 plantas


totales ¼ de estas deberían ser blancas.

El siguiente cuadro resume los k eventos posibles y sus frecuencias observadas y esperadas

Evento o e
Rojas 13 20
Rosadas 42 40
Blancas 25 20
Total 80 80

78
Apuntes de Bioestadística
La Paz, Bolivia, 2002 Juan José Vicente Rojas

Solución

1) Hipótesis
Ho: Los resultados se ajustan a la proporción 1:2:1
Ha: Los resultados no se ajustan a la proporción 1:2:1

2) Región o valor critico

valor tabular de Χ2tab con k-1 gl y alfa = 0.01

k = 3: número de eventos que en este caso son 3 (roja, rosada, blanca) en la tabla;
alpha
gl 0.995 0.99 0.975 0.95 0.90 0.10 0.05 0.025 0.01 0.005
1 3.93E-05 0.00016 0.000982 0.00393 0.0158 2.706 3.84 5.02 6.63 7.88
2 0.010 0.0201 0.0506 0.103 0.211 4.61 5.99 7.38 9.21 10.60
3 0.072 0.115 0.216 0.352 0.584 6.25 7.81 9.35 11.34 12.84

Χ2tab = con k – 1 = 2 gl y alfa 0.01


Χ2tab = 9.21

3) Calculo del estadístico de prueba

 c2 
13  202  42  402  25  202
20 40 20
Χ2c = 3.8

4) Decisión

Χ2c cae en la zona de aceptación de Ho


Como Χ2c es menor a Χ2tab, no podemos rechazar la Hipótesis nula

5) Conclusión

Los resultados se ajustan a la proporción teórica 1:2:1

79
Apuntes de Bioestadística
La Paz, Bolivia, 2002 Juan José Vicente Rojas

Ejemplo.

De 64 descendientes de un cruce entre conejillos de Indias 8 son negros y 56 no lo son,


estos números ( negros y no negros) deberían hallarse en una relación 3:13. Usando un nivel
del 5%, determine si los valores observados son consistentes con el modelo genético.

Datos

N = 8 + 56 = 64
Relación esperada 3 : 13
O también 3/16 13/16

Antes de resolver el ejercicio realicemos algunos cálculos:

La frecuencia esperada de animales negros es en proporción 3/16, es decir que de los 64


animales, 3/16 de estos deberían ser negros:

Animales negros esperados : (3/16)*64 = 12

La frecuencia esperada de animales no negros es en proporción 13/16, es decir que de los


64 animales, 13/16 de estos deberían ser no negros:

Animales no negros esperados : (13/16)*64 = 52

El siguiente cuadro resume los k eventos posibles y sus frecuencias observadas y esperadas

Evento o e
Negros 8 12
No negros 56 52
Total 64 64

Solución

1) Hipótesis

Ho: Los resultados se ajustan a la proporción 3:13


Ha: Los resultados no se ajustan a la proporción 3:13

2) Región o valor critico

valor Χ2tab con k-1 gl y alfa = 0.05

k = numero de eventos que en este caso son 2 (negro y no negro)

Χ2tab = con k – 1 = 1 gl y alfa 0.05


Χ2tab = 3.84

80
Apuntes de Bioestadística
La Paz, Bolivia, 2002 Juan José Vicente Rojas

3) Calculo del estadístico de prueba

 
2 8  12
2

56  52
2

c
12 52

Χ2c = 1.64

4) Decisión

Como Χ2c es menor a Χ2tab, no podemos rechazar la Hipótesis nula

Χ2c cae en la zona de aceptación de Ho

5) Conclusión

Los resultados se ajustan a la proporción teórica 3:13

81
Apuntes de Bioestadística
La Paz, Bolivia, 2002 Juan José Vicente Rojas

Ejercicio.

Mendel presentó las relaciones de la población F2 de un dihíbrido en el chícharo:

Semillas Observadas Relacion teorica Esperadas en 556


Redondas y amarillas 315 9 312.75
Redondas y verdes 108 3 104.25
Arrugadas y amarillas 101 3 104.25
Arrugadas y verdes 32 1 34.75
Suma 556 556

Datos

N = 556
Relación esperada 9:3:3:1
O también 9/16, 3/16, 3/16, 1/16

Antes de resolver el ejercicio verifiquemos algunos cálculos:

La frecuencia esperada de semillas redondas y amarillas es en proporción 9/16, es decir que


de las 556 semillas, 9/16 de estas deberían ser redondas y amarillas:

Semillas redondas y amarillas: (9/16)*556 = 312.75 semillas esperadas

Verifique de la misma forma para el resto.

Solución

1) Hipótesis
Ho: Los resultados se ajustan a la proporción 9:3:3:1
Ha: Los resultados no se ajustan a la proporción 9:3:3:1

2) Región o valor critico

valor Χ2tab con k-1 gl y alfa = 0.05

k = numero de eventos que en este


caso son 4 clases de semillas

Χ2tab = con k – 1 = 3 gl y alfa 0.05


Χ2tab = 7.81

82
Apuntes de Bioestadística
La Paz, Bolivia, 2002 Juan José Vicente Rojas

3) Cálculo del estadístico de prueba

 c2 
315  312.752  108  104.252  101  104.252  32  34.752
312.75 104.25 104.25 34.75

Χ2c = 0.469

4) Decisión

Como Χ2c es menor a Χ2tab, no podemos rechazar la Hipótesis nula

Χ2c cae en la zona de aceptación de Ho

5) Conclusión

Los resultados se ajustan a la proporción teórica 9:3:3:1

83
Apuntes de Bioestadística
La Paz, Bolivia, 2002 Juan José Vicente Rojas

Aplicación de Chi cuadrada en pruebas de Hipótesis acerca de la variación de una


población.

Estadístico de prueba
(n  1) S 2
 c2 
2
Ejemplo.
Una cierta compañía envasadora de salsa de tomate debe usar un tipo de envase en que el
contenido medio por lata tenga una desviación no mayor a 20 gramos, una muestra al azar
de 30 latas tuvo desvió estándar de 26 gr. ¿Qué decisión tomará la compañía en base a este
resultado? Alfa =5% (Caballero, 1975).

Datos
σ = 20 gr; por lo tanto σ2 = (20)2 = 400
α = 0.05
n = 30
S = 26, por lo tanto S2= (26)2 = 676

1) Hipótesis
Ho: σ2 = 400 y la compañía puede usar el nuevo proceso
Ha: σ2 > 400 y la compañía no puede emplear el nuevo proceso por ser mas
variable que el tradicional (en base a la información de la
muestra donde la varianza es mayor)

2) Región o valor critico

Χ2tab con n –1 = 30 - 1
= 29 gl y α = 0.05

Χ2tab = 42.56

3) Cálculo del estadístico de prueba


(30  1)26 2
 c2 
400

Χ2c = 49.01

84
Apuntes de Bioestadística
La Paz, Bolivia, 2002 Juan José Vicente Rojas

4)Decisión

Χ2c > Χ2tab


Χ2c cae en la zona de rechazo de Ho, por lo tanto existe suficiente evidencia para no
aceptarla (entonces aceptamos Ha)

5) Conclusión
La compañía debe usar otro tipo de envase que cumpla la especificación de desvió estándar
no mayor a 20 gramos.

Ejemplo.

En un proceso de llenado, la tolerancia para el peso de los recipientes es de 8 gramos, para


reunir este requisito, la desviación estándar en el peso debe ser de dos gramos. Los pesos
de 25 recipientes seleccionados al azar dieron como resultado una desviación estándar de
2.8 gramos.
¿Si los pesos se encuentran normalmente distribuidos, determinar si la varianza de estos es
diferente del valor necesario? α = 0.05 (Canavos, 1988)

Datos
μ = 8 gramos
σ = 2 gr; por lo tanto σ2 = (2)2 = 4
α = 0.05
n = 25
S = 2.8, por lo tanto S2= (2.8)2 = 7.84

1) Hipótesis

Ho: σ2 = 4 g
Ha: σ2 ≠ 4 g
2) Region o valor critico

Χ2tab con n –1 = 25 - 1= 24 gl y α = 0.05


Χ2tab = 33.36 y 12.40

85
Apuntes de Bioestadística
La Paz, Bolivia, 2002 Juan José Vicente Rojas

3) Cálculo del estadístico de prueba

(25  1)2.8 2
 c2 
4
Χ2c = 47.04

4) Decisión

Χ2c cae en la zona de rechazo de Ho, por lo tanto existe suficiente evidencia para no
aceptarla (entonces aceptamos Ha)

5) Conclusión

En base a la información de la muestra se concluye que la varianza de los recipientes es


diferente del valor necesario.

Ejemplo.

En la región de los Yungas la maquina de embolsado de café de una cooperativa permite


que el peso promedio por bolsa sea de 250 gramos con una desviación típica de 12.5
gramos, sin embargo se observa que el contenido de café es muy variable por bolsa, para
verificar la situación un Ing. Agrónomo decide pesar el contenido de 12 bolsas de café
elegidas aleatoriamente, las cuales arrojan los siguientes pesos;

Nº peso (g)
1 246
2 240
3 253
4 260
5 264
6 271
7 253
8 247
9 263
10 243
11 241
12 253
Verifique si los pesos registrados cumplen con la norma de embolsado de café a un nivel del
1%.

Solución
Antes de resolver el ejercicio calculemos algunos estadísticos que nos puedan ser útiles:
x = 252.83 g
S = 9.96 g
S2 = 99.24

86
Apuntes de Bioestadística
La Paz, Bolivia, 2002 Juan José Vicente Rojas

Datos
μ = 250 gramos
σ = 12.5 gr; por lo tanto σ2 = (12.5)2 = 156.25
α = 0.01
n = 12
S = 9.96, por lo tanto S2= (9.96)2 = 99.24

1) Hipótesis

Ho: σ2 = 156.25 g
Ha: σ2 ≠ 156.25 g
2) Region o valor critico

Χ2tab con n –1 = 12 - 1= 11 gl y α = 0.01 o 1%


Χ2tab = 26.76 y 2.60

3) Cálculo del estadístico de prueba

(12  1)9.96 2
 
2
c
156.25
Χ2c = 6.98

4) Decisión

χ2 cae en la zona de aceptación de Ho, por lo tanto no rechazamos la Ho

5) Conclusión

En base a la información de la muestra se concluye que varianza del peso de embolsado de


café cumple con las normas de producción.

87
Apuntes de Bioestadística
La Paz, Bolivia, 2002 Juan José Vicente Rojas

Ejemplo.
El proceso de producción de jabón de tocador de una compañía permite que cada unidad
tenga un peso promedio de 75 gramos con variación estándar de 1.5 g, un ingeniero
industrial desarrolla un nuevo proceso mas económico y una muestra de 10 jabones arroja
los siguientes resultados (Richards, 2001).
73.15
74.51
76.15
76.18
74.25
75.86
76.35
75.45
75.15
75.85

La compañía esta dispuesta a aceptar el nuevo proceso solo si este resulta igual o menos
variable que el proceso tradicional.¿A un nivel del 5% y asumiendo que el peso de los
jabones de tocador se distribuye normalmente, que decisión tomará la compañía?.

Solución

Antes de resolver el ejercicio calculemos algunos estadísticos que nos puedan ser útiles:
x = 75.29 g
S = 0.98 g
S2 = 0.96

Datos
Datos
μ = 75 gramos
σ = 1.5 gr; por lo tanto σ2 = (1.5)2 = 2.25
α = 0.05
n = 10
S = 0.98, por lo tanto S2= (0.98)2 = 0.96

1) Hipótesis

Ho: σ2 = 2.25 g “Y la compañía aceptara el nuevo proceso”


Ha: σ2 > 2.25 g “Y la compañía rechaza el nuevo proceso por
ser mas variable”

2) Región o valor critico

Χ2tab con n –1 = 10 - 1= 9 gl y α = 0.05


Χ2tab = 16.92

88
Apuntes de Bioestadística
La Paz, Bolivia, 2002 Juan José Vicente Rojas

3) Cálculo del estadístico de prueba

(10  1)0.98 2
 c2 
2.25

Χ2c = 3.84

4)Decisión

Χ2c < Χ2tab

Χ2c cae en la zona de aceptación de Ho, por lo tanto no rechazamos la Ho

5) Conclusión

En base a la información de la muestra se concluye que varianza del peso del nuevo proceso
es similar a la varianza del antiguo proceso, por lo que la compañía puede aceptarla,
además este proceso es más económico

89
Apuntes de Bioestadística
La Paz, Bolivia, 2002 Juan José Vicente Rojas

DISTRIBUCIÓN DE F

Una prueba de F es una relación entre dos varianzas para determinar si dos estimaciones
de varianzas independientes pueden ser admitidas como estimaciones de una misma
varianza (Little y Hills, 1976). La prueba de t para dos muestras, descrita anteriormente
supone que las varianzas de las dos poblaciones muestreadas sean similares, para esto es
necesario probar la hipótesis de nulidad: σ12 = σ22

Ejemplo.
Se desea averiguar a través de la prueba de F si, desde el punto de vista de las varianzas,
dos instrumentos A y B tiene la misma precisión en la medida de las longitudes. Para ello se
efectúan con cada uno de los aparatos A y B seis medidas de una misma longitud,
obteniéndose como resultado las siguientes varianzas de las muestras:

Instrumento A: S2 = 0.004344
Instrumento B: S2 = 0.005136

Solución
Se asumirá el nivel de significación de 1% el numero de observaciones de cada muestra es
nA = nB = 6

1) Hipótesis
Ho: σ2A = σ2B “Ambos instrumentos tienen similar variación en la
medición de longitudes”
Ha: σ2A ≠ σ2B “La variación en la medida de longitudes es
diferente ”
2) Región o valor critico

F tab con gl nA – 1 y gl nB - 1
Gl nA= 6-1= 5
Gl nB= 6-1= 5

F tab= 5 y 5 gl y α = 0.01: buscando en la tabla tenemos:

Grados de
libertad Grados de libertad v1
V2 1 2 3 4 5 6
1 161 200 . . 230 .
4052 4999 . . 5764 .

2 18.51 19 . . 19.3 .
93.49 99 . . 99.3 .

3 10.13 9.55 . . 9.01 .


34.12 30.82 . . 28.24 .

4 7.71 6.94 . . 6.26 .


21.2 18 . . 15.52 .

5 6.61 5.79 . . 5.05 .


16.26 13.27 . . 10.97 .

6 5.99 5.14 . . 4.39 .


13.74 10.92 . . 8.75 .

90
Apuntes de Bioestadística
La Paz, Bolivia, 2002 Juan José Vicente Rojas

Donde las cifras en letra normal son al 5% y las cifras en negrillas son al 1%
F tab= 10.97

3) Cálculo del estadístico de prueba

S 2 Mayor
Fc 
S 2 Menor

0.005136
Fc 
0.004344

Fc = 1.18

4) Decisión

Fc < F tab

Fc cae en la zona de aceptación de Ho, por lo tanto no rechazamos la Ho

5) Conclusión

La diferencia entre varianzas se debe al azar, la variación en la medición de longitudes de


ambos instrumentos es similar.

91
Apuntes de Bioestadística
La Paz, Bolivia, 2002 Juan José Vicente Rojas

Ejemplo.

Los datos se refieren al incremento diario de peso de dos grupos de corderos alimentados
con dos raciones diferentes, isoproteicas e isoenergeticas, pero donde la fuente proteica
principal fue harina de soya y torta de girasol. Cabe aclarar que el numero de elementos de
los grupos fue diferente (Rodríguez del Angel, 1991).

Harina de soya Torta de girasol


218 194
224 201
235 216
241 218
222 199
241 185
237 210
229 216
234 204
241
236
Cálculos:
Media: Media soya = 232.54 , Media de girasol = 207.77

Desvió Estándar: Ssoya= 8.14, Sgirasol =11.23

Varianza : S2soya=66.27, S2girasol=126.19

Notemos que la mayor varianza corresponde a torta de girasol y la menor varianza a Harina
de soya, es importante determinar esto cuando se tienen muestras de diferente tamaño para
emplear adecuadamente la tabla de F.

Solución
Se asumirá el nivel de significación de 5% el numero de observaciones de cada muestra es
nsoya = 11
Ngirasol = 9

1) Hipótesis
Ho: σ2girasol = σ2soya “Ambas raciones tienen similar variación en
el incremento diario de peso de los corderos.”
Ha: σ2girasol ≠ σ2soya “La variación en el incremento de peso por efecto de
las raciones es diferente ”

2) Región o valor critico

F tab con gl nsoya – 1 y gl ngirasol - 1


Gl nsoya= 11-1= 10
Gl ngirasol= 9-1= 8

92
Apuntes de Bioestadística
La Paz, Bolivia, 2002 Juan José Vicente Rojas

F tab= 10 y 8 gl y α = 0.05: buscando en la tabla donde en la parte superior van los gl del
mayor cuadrado medio o varianza (gl de varianza de T. De girasol) y hacia abajo los
gl del menor cuadrado medio (gl de varianza de H. De soya) tenemos :

Grados de
libertad v2 →Grados de libertad v1 (Mayor CM)
(Menor CM)↓ 1 2 . . 8 11
1 161 200 . . 239 .
4052 4999 . . 57.64 .

2 18.51 19 . . 19.37 .
93.49 99 . . 99.36 .
. . . . . . .
. . . . . .

9 5.12 4.26 . . 3.23 .


10.56 8.02 . . 5.47 .

10 4.96 4.10 . . 3.07 .


10.04 7.56 . . 5.06 .

F tab= 3.07

3) Cálculo del estadístico de prueba

S 2 Mayor
Fc  2
S Menor

126.19
Fc 
66.27
Fc = 1.94

93
Apuntes de Bioestadística
La Paz, Bolivia, 2002 Juan José Vicente Rojas

4) Decisión

Fc < F tab

Fc cae en la zona de aceptación de Ho, por lo tanto no rechazamos la Ho

5) Conclusión

La diferencia entre varianzas se debe al azar, la variación en el incremento diario de peso


por el efecto de las dos raciones es similar.

Ejemplo.

Con el propósito de estudiar dos tipos de raciones se eligieron al azar dos grupos de
terneros, el primer grupo recibió como suplemento torta de soya y el segundo grupo un
concentrado de proteína y torta de soya, la ganancia en g/día fue:

Grupo 1 Grupo 2
885.30 826.28
985.18 839.90
935.24 848.98
957.94 789.96
1016.96 926.16
1144.08 808.12
926.16 799.04
885.30 844.44

Antes de realizar la prueba de t, pruebe la Hipótesis nula de igualdad de varianzas de ambos


grupos en la ganancia diaria de peso al nivel del 5%.

Cálculos:

Desvió Estándar: S1 = 84.762 S2 = 42.658


2 2
Varianzas : S 1 = 7184.614 S 2 =1819.709

Solución
El nivel de significación es de 5% el numero de observaciones de cada muestra es
n1 = n2 = 8, además la mayor varianza corresponde al grupo 1.

1) Hipótesis
Ho: σ21 = σ21 “Ambas raciones tienen similar variación en
La ganancia diaria de peso de los terneros.”

Ha: σ21 ≠ σ22 “La variación en la ganancia diaria de peso por efecto de
las raciones es diferente ”

94
Apuntes de Bioestadística
La Paz, Bolivia, 2002 Juan José Vicente Rojas

2) Región o valor critico

F tab con gl n1 – 1 y gl n2 - 1
Gl n1= 8-1= 7
Gl n1= 8-1= 7

F tab = 3.79

3) Cálculo del estadístico de prueba

S 2 Mayor
Fc 
S 2 Menor

7184.614
Fc 
1819.709

Fc = 3.948

4) Decisión

Fc > F tab

Fc cae en la zona de rechazo de Ho

5) Conclusión

Existen diferencias estadísticas entre las varianzas de la ganancia diaria entre los dos grupos
de terneros.

95
Apuntes de Bioestadística
La Paz, Bolivia, 2002 Juan José Vicente Rojas

ANALISIS DE VARIANZA

Es una técnica ampliamente utilizada. Empleada para demostrar si las diferencias entre las
medias de varias muestras se atribuyen a la oportunidad o si indican diferencias reales entre
las medias de las poblaciones muestreadas (Freund y Manning, 1989).

Caballero (1975), en su forma más simple significa desdoblar la varianza de un conjunto de


observaciones en componentes, uno de los cuales es la variación de las muestras y otra es
la variación existente en las observaciones dentro de cada muestra.

Supuestos importantes:

 Distribución normal de las observaciones


 Homogeneidad de varianzas

Notación.
Xij = j-esima observación correspondiente a la i-ésima muestra
Xi. = Total correspondiente a la i-ésima muestra (para obtenerlo sumamos las j-ésimas
observaciones correspondientes a la muestra)
X.. = Gran total (G) suma de todas las observaciones

Cuadro de Analisis de Varianza:

Fuente Grados Suma de Cuadrado F F


Variabilidad Libertad Cuadrados Medio calculado tabular
Entre Muestras t–1 SCEntre CMEntre =SCEntre/t-1 CMEntre/CMdentro
Dentro de Muestras t (r –1) SCDentro CMDentro=SCDentro/t(r-1)
Total t*r - 1

t = Numero de muestras
r = Numero de observaciones por muestra

Ejemplo.

Para estudiar la efectividad de cinco tipos diferentes de empaquetado, un procesador de


alimentos para el desayuno obtuvo los datos siguientes sobre los números de ventas en
cinco días diferentes (Freund y Manning, 1989).

Muestras
Empaque 1 2 3 4 5
Empaque 1 60 52 56 52 65
Empaque 2 54 64 66 54 67
Empaque 3 55 66 68 57 55
Empaque 4 55 56 70 58 56
Empaque 5 71 65 60 59 62

Realice un análisis de varianza para demostrar en el nivel de significancia de 0.05 si las


diferencias entre las cinco medias de la muestra se pueden atribuir a la oportunidad.

96
Apuntes de Bioestadística
La Paz, Bolivia, 2002 Juan José Vicente Rojas

Solución.

Obteniendo totales

Muestras
Empaque 1 2 3 4 5 Total muestra (Xi.)
Empaque 1 60 52 56 52 65 285
Empaque 2 54 64 66 54 67 305
Empaque 3 55 66 68 57 55 301
Empaque 4 55 56 70 58 56 295
Empaque 5 71 65 60 59 62 317
1503 (Gran Total X..)

Planteo de hipótesis

Ho : μ1 = μ2 = μ3 = μ4 = μ5, “La media del numero de ventas es la misma en cualquier


tipo de empaque”
Ho : “La media del número de ventas por dia es diferente en al menos un tipo de
empaque”

Cálculos

Factor de corrección (FC)

X ..2 15032
FC  FC   90360.36
t xr 5 x5

Suma de Cuadrados Entre muestras (Para este calculo necesitamos totales de muestra)

SCEntre   i.  FC
X2
r

285 2  305 2  3012  295 2  317 2


SCEntre   FC 112.64
5

Suma de Cuadrados Total

SCTotal   X ij2  FC

SCTotal  60 2  52 2  56 2  ...  62 2  FC  91173  90360.36  812.64

97
Apuntes de Bioestadística
La Paz, Bolivia, 2002 Juan José Vicente Rojas

Suma de Cuadrados Dentro

SCDentro  SCTotal  SCEntre


SCDentro= 812.64 – 112.64
SCDentro= 700

Análisis de varianza

FV GL SC CM Fc F tabular
Entre Empaques 5–1=4 112.64 28.16 0.804 2.87
Dentro de Empaques 5(5-1) = 20 700 35
Total 5*5-1= 24 812.64

Donde: CM = SC/GL
Fc = CMEntre/CMDentro es el estadístico de prueba

Decisión

Si F calculado < F tabular : Acepte Ho


Si F calculado > F tabular : Rechace Ho

F calculado = 0.804

F tabular (5%) = 2.87 (Buscar en la tabla de distribución de F con 4 y 24 gl al 5%)

Grados de Grados de libertad v1 (GL ENTRE)


libertad v2 →
(GL DENTRO)↓ 1 2 3 4 5 6
1 161 200 . 225 230 .
4052 4999 . 5625 5764 .

2 18.51 19 . 19.25 19.3 .


93.49 99 . 99.25 99.3 .

3 10.13 9.55 . 9.12 9.01 .


34.12 30.82 . 28.71 28.24 .
. . . . . .
. . . . . .
. . . . . .
. . . .
20 4.35 3.49 . 2.87 4.39 .
8.10 5.85 . 4.43 8.75 .

98
Apuntes de Bioestadística
La Paz, Bolivia, 2002 Juan José Vicente Rojas

Como el valor F calculado es menor al valor F tabular, no podemos rechazar la hipótesis nula

Conclusión.
No existen diferencias estadísticas entre los diferentes tipos de empaquetado en cuanto al
numero de ventas.

NOTA: El mínimo valor de F calculada debiera ser 1

Ejemplo.

La superficie en hectáreas, sembradas de maíz, se registro en una muestra al azar extraída


de tres valles. Determine si hay diferencias significativas en el numero de hectáreas de maíz
sembradas por hacienda en los tres valles estudiados (Caballero,1975).

Hectáreas sembradas de maíz


Hacienda Valle A Valle B Valle C
1 18 25 1
2 2 29 5
3 31 15 4
4 26 45 10
5 40 36 15
6 55 38 60
7 17 26 80
8 1 30 95
9 150 20 76
10 25 35 100

99
Apuntes de Bioestadística
La Paz, Bolivia, 2002 Juan José Vicente Rojas

Solución.

Obteniendo totales

Hectáreas sembradas de maiz


Hacienda Valle A Valle B Valle C
1 18 25 1
2 2 29 5
3 31 15 4
4 26 45 10
5 40 36 15
6 55 38 60
7 17 26 80
8 1 30 95
9 150 20 76
10 25 35 100
Total Xi. 365 299 446 1110
Gran total X..

Planteo de hipótesis

Ho : μ1 = μ2 = μ3, Las medias de los tres valles en el número de hectáreas sembradas


de maíz no presentan diferencias significativas

Ha : La media del numero de hectáreas sembradas de maiz es distinta en al menos


un valle

Cálculos

Factor de corrección (FC)

X ..2 1110 2
FC  FC   41070
t xr 3 x 10

Suma de Cuadrados Entre muestras (Para este calculo necesitamos totales de muestra)

SCEntre   i.  FC
X2
r

365 2  299 2  446 2


SCEntre   FC 1084.2
10
Suma de Cuadrados Total

SCTotal   X ij2  FC

SCTotal 182  2 2  312  ... 100 2  FC  74830  41070  33760


100
Apuntes de Bioestadística
La Paz, Bolivia, 2002 Juan José Vicente Rojas

Suma de Cuadrados Dentro

SCDentro  SCTotal  SCEntre

SCDentro = 33760 – 1084.2


SCDentro = 32675.8

Análisis de varianza

FV GL SC CM Fc F tabular (5%)
Entre Valles 3-1 = 2 1084.2 542.1 0.447 3.35
Dentro Valles 3(10-1) = 27 32675.8 1210.21
Total 30-1 = 29 33760

Decisión

Si F calculado < F tabular : Acepte Ho


Si F calculado > F tabular : Rechace Ho

F calculado = 0.447

F tabular (5%) = 3.35

Como el valor F calculado es menor al valor F tabular, no podemos rechazar la hipótesis nula

Conclusión.

No existen diferencias estadísticas entre los valles en el número de hectáreas sembradas de


maíz. Dicho de otro modo; la media del número de hectáreas sembradas de maíz es el
mismo para cualquier valle

101
Apuntes de Bioestadística
La Paz, Bolivia, 2002 Juan José Vicente Rojas

Ejemplo.

De una investigación hecha sobre alimentación en ovinos, medida como ganancia de peso
en un cierto periodo, se obtuvo la información que se ofrece. Realice el análisis de varianza y
obtenga sus conclusiones(Caballero, 1975).

Ración A Ración B Ración C


n 5 5 5
Σx 68 61 38
2
Σx 982 945 300

El cuadro presenta información reducida, siendo el numero de observaciones (r) por racion
igual a 5. Y el numero de muestras (raciones) igual a 3

t=3
r=5

Σx = es el total de cada ración (X i.)

El gran total se obtiene:


X.. = 68 + 61 + 38 = 167
Se empleará el nivel de significación del 5%.

Planteo de hipótesis

Ho : μ1 = μ2 = μ3, No existen diferencias entre las medias de ganancia


de peso de ovinos entre las tres raciones
Ha : Al menos alguna media es distinta de las demás

Cálculos

Factor de corrección (FC)

X ..2 167 2
FC  FC  1859.26
t xr 3x5

Suma de Cuadrados Entre muestras (Para este calculo necesitamos totales de muestra)

SCEntre   i.  FC
X2 68 2  612  38 2
SCEntre   FC  98.54
r 5

Suma de Cuadrados Total (Para este cálculo recurrimos a los datos de la tabla Σx2 que
indican que el valor de cada observación de las raciones se sumo y elevo al cuadrado)

SCTotal   X ij2  FC

102
Apuntes de Bioestadística
La Paz, Bolivia, 2002 Juan José Vicente Rojas

SCTotal  982  945  300  FC  2227 1859.26  367.74

Suma de Cuadrados Dentro

SCDentro  SCTotal  SCEntre

SCDentro= 367.74 – 98.54


SCDentro= 269.2

Análisis de varianza
FV GL SC CM Fc F tabular (5%)
Entre Raciones 3-1 = 2 98.54 49.27 2.19 3.88
Dentro de Raciones 3(5-1) =12 269.2 22.43
Total 3*15-1 =14 33760

Decisión

Si F calculado < F tabular : Acepte Ho


Si F calculado > F tabular : Rechace Ho

F calculado = 2.19

F tabular (5%) = 3.88

Como el valor F calculado es menor al valor F tabular, no podemos rechazar la hipótesis nula

Conclusión.

No se detectan diferencias estadísticas entre las raciones sobre la ganancia de peso de


ovinos, las raciones tienen un efecto similar en la ganancia de peso.

103
Apuntes de Bioestadística
La Paz, Bolivia, 2002 Juan José Vicente Rojas

CORRELACION Y REGRESION LINEAL

Coeficiente de correlación lineal (r). Mide el grado de asociación entre las dos variables X
e Y. Los valores que puede tomar r son; - 1 ≤ r ≤ 1.Es decir entre - 1 y 1. Si r tiende a 0 se
dice que no existe asociación lineal entre las dos variables estudiadas, los puntos del
diagrama de dispersión no tienden a formar una línea recta.
Si r tiende a 1 se dice que existe alta asociación positiva lineal entre X e Y. Los puntos
tenderán a formar una línea recta.
Si r tiende a – 1 se dice que existe alta asociación lineal en sentido negativo entre X e Y.

 X  Y 
 XY  n
r
  X   
 X  
2
 Y  2


2

n 
 Y 
n
2


 

Coeficiente de determinación ( r2 ).indica la proporción en la variabilidad total de Y que se


debe a la variable X. Se multiplica el valor de r2 por 100.es un indicador de la bondad de
ajuste.

Coeficiente de regresión (b). Indica el monto de cambio en la variable dependiente (Y), por
cada unidad de cambio en la variable independiente X. Representa la pendiente de la línea
recta.

 X  Y 
 XY  n
b
 X 2
X 2

n

Intercepto (a). Indica el punto donde la recta de regresión cruza al eje Y.

a
 Y  b X
n n

Ecuación de regresión. La forma general es:

y =a+bx

104
Apuntes de Bioestadística
La Paz, Bolivia, 2002 Juan José Vicente Rojas

Ejemplo.

Un grupo de cerdos de igual raza, edad y sexo, a partir de la octava semana de vida fue
sometido a pesadas cada dos semanas, hasta que llegaron a las 28 semanas de vida
(Caballero,1975). A continuación se dan los datos de la edad en semanas (X) el peso
promedio en Kg (Y) y los cálculos necesarios para obtener la correlación y regresión lineal.

X Y
2 2
Edad (Semanas) Peso (Kg.) X Y XY
8 17.97 64 322.9209 146.76
10 24.56 100 603.1936 245.6
12 31.15 144 970.3225 373.8
14 35.07 196 1229.9049 490.98
16 49.45 256 2445.3025 791.2
18 59.72 324 3566.4784 1074.96
20 68.8 400 4733.44 1376
22 76.22 484 5809.4884 1676.84
24 86.77 576 7.522.0329 2082.48
26 89.03 676 7.926.3409 2314.78
28 90.78 784 8.241.0084 2541.84
2 2
ΣX=198 ΣY=629.52 ΣX =4004 ΣY =43377.4334 ΣXY=13112.24

Diagrama de dispersión.

Diagrama de dispersión Edad vs Peso

90

80

70
peso (kg)

60

50

40

30

20

10 20 30

edad (semanas)

Observar que a mayor edad también se incrementa el peso

105
Apuntes de Bioestadística
La Paz, Bolivia, 2002 Juan José Vicente Rojas

Coeficiente de correlación lineal ( r ).

r= Σ XY - (ΣX)(ΣY)/n
√[ΣX 2 – (ΣX)2/n][ ΣY 2 – (ΣY)2/n]

r= 13112.24 - (198)(629.52)/11
√[4004 – (198)2/11][ 43377.4334 – (629.52)2/11]

r = 0.99

Existe alta correlación positiva lineal entre la edad de los cerdos (X) y el peso (Y).Se puede
esperar que a medida que la edad se incremente, también se incremente el peso.

Coeficiente de determinación ( r 2).

r 2 x 100 = 0.99 2 x100 = 98.06 %

La edad de los cerdos explica el 98.06 % de la variación total en el peso.

Coeficiente de regresión ( b ).

b = Σ XY - (ΣX)(ΣY)/n
[ΣX 2 – (ΣX)2/n]

b = 13112.24 - (198)(629.52)/11
[4004 – (198)2/11]

b = 4.047 kg .Por cada semana de incremento en la edad, se espera en promedio un


incremento de 4.047 kg en el peso.

Intercepto ( a ).
a = ΣY – b ΣX
n n

a = 629.52 – 4.047 x198


11 11
a = - 15.617

representa el intercepto de la recta de regresión con el eje “y”.

Ecuación de regresión.
Y = -15.617 + 4.047 X

La cual se puede emplear para interpolaciones entre los valores estudiados, si existe alta
asociación entre las variables estudiadas. Se debe tener mucho cuidado para realizar
extrapolaciones fuera del rango estudiado.

NOTA: los valores de r, b, a, ΣX, ΣY, ΣX2, ΣY2, ΣXY, pueden obtenerse directamente con
calculadoras científicas en el MODO LR.

106
Apuntes de Bioestadística
La Paz, Bolivia, 2002 Juan José Vicente Rojas

Ejemplo.

De 12 jugadoras de baloncesto se tiene registrados sus pesos (Y) y sus estaturas (X) en
kilogramos y centímetros respectivamente:

Estatura (X) Peso (Y)


155 44
161 60
168 72
170 77
173 68
175 70
159 60
165 62
170 65
172 70
174 69
176 71
Calcular r, r2, b e interprete

Resultados obtenidos mediante calculadora

n = 12 ΣY2 = 52544
ΣX = 2018 ΣXY = 133042
ΣY = 788 r = 0.82
ΣX2 = 339866 b = 1.04

Coeficiente de correlación (r)


r = 0.82

El coeficiente de correlación indica el grado de asociación lineal entre la estatura (X) y el


peso (Y), 0.82 es un valor alto que indica que estas variables presentan alta asociación
lineal, por el signo del coeficiente podemos decir que a medida que la estatura aumente
también lo hará el peso de las jugadoras.

Coeficiente de determinación (r2)

r2 = 0.822*100
r2 = 68.68 %

podemos afirmar que la estatura (X) de las jugadoras explica el 68.68% de la variación en su
peso (Y).

Coeficiente de regresión (b)


b = 1.04 kg

Por cada cm de incremento en la estatura (X) se espera un incremento promedio de 1.04 kg


en el peso (Y) de las jugadoras

107
Apuntes de Bioestadística
La Paz, Bolivia, 2002 Juan José Vicente Rojas

DETERMINACIÓN DEL TAMAÑO DE LA MUESTRA (n)

Anteriormente se describieron los métodos de muestreo (simple, estratificado, sistemático)


con tamaño de muestra ya establecido. Generalmente es recomendable determinar el
tamaño de muestra antes de aplicar el método de muestreo.

¿Por qué es importante determinar el tamaño de la muestra?


 Mejora las posibilidades de haber seleccionado una muestra representativa que sea
útil. Tanto la representatividad como la utilidad determinaran la posibilidad que
tendremos para extraer inferencias de la población que puedan repetirse por otros
investigadores. (Loetz, 1999)

Tamaño de muestra necesaria para estimar una media.-

a) Empleando la distribución de z.

 z*  
2

n 
 E 

Donde : n = número de observaciones necesarias


Z = Valor estandarizado de la curva normal, depende del intervalo de
confianza deseado
al 1%=2.58, 5%=1.96, 10%=1.64
σ = Valor de la variabilidad de la característica de interés (σ, σ 2 , CV)
Desvió estándar, varianza, Coeficiente de Variación de la población
respectivamente
E = Margen de error que estamos dispuestos a aceptar en relación al
valor de la media

Por ejemplo empleando un nivel del 5% obtendremos:

la distribución normal estandarizada asume como valores críticos los valores de –1.96 y 1.96,
el intervalo de entre estos dos valores contiene el 95 % de probabilidad.

108
Apuntes de Bioestadística
La Paz, Bolivia, 2002 Juan José Vicente Rojas

Ejemplo.

Un investigadora quiere determinar el tiempo promedio que un mecánico tarda en


intercambiar los neumáticos de un automóvil, y además desea poder asegurar con una
confianza del 95% que la media de su muestra varíe en ± 0.5 minutos del valor de la media
poblacional, si puede presumir por experiencia que la desviación estándar; σ = 1.6 minutos.
¿ Cual el tamaño que debe tener n?. (Miller et al. ,1992).

Datos:
Z =1.96 (En función del nivel de significancia; 5%, por lo que el intervalo de Confianza (IC) es
95%)
E =0.5 minutos
σ = 1.6 minutos

GRAFICAMENTE :

Lo que se puede explicar : que se desea un tamaño de muestra con un nivel de confianza
del 95 % de que la media de la muestra (x) , se aleje en ± 0.5 minutos del verdadero valor de
la media ( μ ).

Datos:
Z =1.96
E =0.5 minutos
σ = 1.6 minutos
(Nótese que E y σ tienen las mismas unidades; minutos)

2
 1.96 * 1.6 
n 
 0.5 

n = 39.33 = 40

Respuesta: se debe observar 40 ejecuciones de la tarea de intercambiar neumáticos de un


automóvil.

109
Apuntes de Bioestadística
La Paz, Bolivia, 2002 Juan José Vicente Rojas

Ejemplo.

Los estudiantes de la materia de Bioestadística de la Facultad de Agronomía desean


estimar el promedio de diámetro a la altura pecho (DAP) de los árboles de Eucalipto de una
zona verde de la ciudad de La Paz, se sabe que el diámetro altura pecho (DAP) posee un
coeficiente de variación (CV) del 20%, y los estudiantes desean una muestra en la que la
media varíe en ± 3% del verdadero valor de la media poblacional (μ), a un nivel de
significancia del 10%.

Datos
Z = 1.64 (Puesto que el nivel de significancia es 10%, el IC es 90%)
E = 3%
CV = 20%
(Habrá que hacer notar que E y CV tiene las mismas unidades; %)

GRÁFICAMENTE:

2
 1.64 * 20 
n 
 3 

n = 119.53 ≈ 120
n = 120

Respuesta : Se deben medir 120 árboles

“Las unidades de E (diferencia deseable de detectar) y σ (variación) deben ser las mismas,
es decir sí la variación esta en Kg, E también debe estar en Kg)
Sí se emplea un Coeficiente de Variabilidad (CV) como medida de la variación, que se mide
como porcentaje(%), E también debe tener % como unidad. Esto se explica porque el
tamaño de muestra calculado no debe tener unidades, por lo tanto las unidades de los
términos de la fórmula tanto en el numerador como en el denominador deben cancelarse, el
valor z tabular no tiene unidades”

110
Apuntes de Bioestadística
La Paz, Bolivia, 2002 Juan José Vicente Rojas

Ejemplo.

Se desea estudiar el peso promedio de las ovejas de una granja del altiplano para esto se
tiene como datos recopilados; el menor peso de una oveja = 21 kg y el máximo peso = 33 kg.
El investigador solo desea equivocarse en ± 5% del verdadero valor de la media y a un nivel
de confianza del 1%.¿ cuantas ovejas debe pesar?

Datos:
Z = 2.58 (Ya que el nivel de significancia es 1% ,el Intervalo de Confianza (IC) es 99%)
Mínimo peso = 21 kg.
Máximo peso = 33 kg.
E = 5%

Una forma de estimar el CV conociendo un mínimo y máximo valor es empleando la formula:


(Loetz,1999)
 max valor  min valor 
CV    *100
 2max valor  min valor 

Reemplazando:
 33  21 
CV    *100
 233  21
CV = 11.1%, esta es la variabilidad de la característica de interés

GRÁFICAMENTE:

2
 2.58*11.1 
n 
 5 

n = 32.8 ≈ 33
Respuesta: Se deben realizar el pesado de 33 ovejas

111
Apuntes de Bioestadística
La Paz, Bolivia, 2002 Juan José Vicente Rojas

Para aplicar este método se puede realizar la medición de varios sujetos para tener idea de
lo que es un valor mínimo y un valor máximo (Loetz,1999).
Generalmente se asume para los anteriores métodos descritos por fines prácticos que la
población es grande o infinita, para el anterior ejemplo siendo la variable de interés (peso) de
naturaleza continua supongamos que se conoce el total de ovejas de la granja, como
N= 180, cuantas se deben muestrear?.

Para esto podemos ajustar el calculo de la muestra inicial (n0 =33) con la siguiente relación
(Martínez, 1997):

n0
n
n
1 0
N

Ajustando:

33
n
33
1
180

n= 27.88 ≈28 ovejas

También se puede aplicar directamente la relación:

Z 2 * N * 2
n
N * E 2  Z 2 * 2

2.58 2 *180 *11.12


n
180 * 5 2  2.58 2 *11.12

n = 27.74 ≈ 28 ovejas

112
Apuntes de Bioestadística
La Paz, Bolivia, 2002 Juan José Vicente Rojas

b) Empleando la distribución de t.

Como generalmente no se conoce σ o σ 2 , sino S o S 2, es más práctico emplear la


distribución de t ( muestras pequeñas, n<30). El método es descrito por Loetz (1999):

2
 t* S 
n 
 E 

Donde : t = Valor tabular de la distribución estudentizada con n-1 GL y a un


determinado nivel de significancia.
S = Valor de la variabilidad de la característica de interés (S, S 2 , CV)
Desvió estándar, varianza, Coeficiente de Variación de la muestra
respectivamente
E = Margen de error que estamos dispuestos a aceptar en relación al
valor de la media

En este método es necesario el empleo de tablas de la distribución estudentizada (t).

Ejemplo. Se desea determinar el peso medio de un proceso de envasar café, de


experiencias anteriores se sabe que S =5.3 gr. El nivel de significancia es de 10%, y el
investigador no desea equivocarse en mas de 2 gr. del valor de la media. ¿Cuántos envases
debe pesar? (Ej. Hipotético)

Solución:
S = 5.3
α = 10 % ó 0.1 (De lo que se deduce que el Intervalo de Confianza (IC) es 90%)
E = 2 gr.

113
Apuntes de Bioestadística
La Paz, Bolivia, 2002 Juan José Vicente Rojas

Primer ciclo:

Se procede a calcular el valor de t tabular inicialmente con 30 GL y


α = 0.1(prueba bilateral)
t tabular = 1.697

reemplazando en la formula:
2
 1.697 * 5.3 
n 
 2 
n = 20.22
n = 23

Segundo ciclo:

Con el valor de n = 23, se procede a calcular el nuevo tamaño de muestra.


Se procede a calcular el nuevo valor de t tabular con 22 GL y α = 0.1(prueba bilateral)
t tabular = 1.717

reemplazando en la formula:

2
 1.717 * 5.3 
n 
 2 

n = 20.70 ≈ 21
n = 21

Tercer ciclo:

Con el valor de n = 21, se procede a calcular el nuevo tamaño de muestra.


Se procede a calcular el nuevo valor de t tabular con 20 GL y α = 0.1(prueba bilateral)
t tabular = 1.725
reemplazando en la formula:

2
 1.725 * 5.3 
n 
 2 

n = 20.89 ≈ 21
n = 21

Como el resultado se estabiliza en n = 21, el investigador debe pesar 21 envases.

“Cuando se emplea la distribución de t, también se pueden emplear los procedimientos


usados con la distribución de z, para la estimación de la variabilidad ( S, S2,CV)”

114
Apuntes de Bioestadística
La Paz, Bolivia, 2002 Juan José Vicente Rojas

Tamaño de muestra necesaria para estimar una proporción poblacional.

z2 * p *q Donde p = proporción a favor de un evento


n
E2 q = proporción en contra el evento

Ejemplo.
Se desea estimar la proporción real de unidades defectuosas en un cargamento especifico
muy grande de ladrillos de adobe y que se necesita una confianza del 95% de que el error
sea a lo sumo 0.04, se sabe que la proporción real (por experiencia) es de 0.12. ¿Cuál es el
tamaño de la muestra? (Miller et al., 1992).

Solución:
Z = 1.96 ( Valor de la distribución normal estándar dos colas al 5%)
p = 0.12 (Probabilidad que sea defectuoso ; “ a favor “)
q = 0.88 (Probabilidad que no sea defectuoso, es decir bueno ;“en contra” )
E = 0.04

n = 1.96 2 * 0.12*0.88 = 253.54 ≈ 254


0.04 2

n = 254 ladrillos
Repuesta : Se deben muestrear 254 ladrillos

Tamaño de muestra necesaria para estimar una proporción poblacional finita.

z2 * p *q
n
z2 * p *q
E2 
N

Ejemplo.

Se desea estimar la proporción de agricultores que usan semilla certificada en una


comunidad de 350 familias, con un Intervalo de confianza de 90% y un error de 5%,
¿Cuantas familias deben encuestarse?.

Solución:
Z para IC=90%; Z=1.64
E = 15 % ó 0.15
p=0.5 ( si usa)
q=0.5 ( no usa)

n = 1.64 2 * 0.5 * 0.5 = 27.53


0.15 2 +1.64 2 0.5*0.5
350

n = 27.53 ≈ 28
En este ejemplo como no se tienen referencias de p y q se asume 0.5 para ambas (siempre
p + q = 1).

115
Apuntes de Bioestadística
La Paz, Bolivia, 2002 Juan José Vicente Rojas

BIBLIOGRAFÍA.

Caballero, W. 1985. Introducción a la Estadística. Instituto Interamericano de Cooperación


para la Agricultura. San José, Costa Rica. 289 p.

Canavos, G. 1988. Probabilidad y Estadística: Aplicaciones y Métodos. McGraw-Hill.México,


México. 651 p.

Castañeda, P. 1995. Bioestadística aplicada. Editorial Trillas S.A. de C.V. México. 213 p.
Hernández, R., Fernández, C., Baptista, P. 1991. Metodología de la investigación. McGraw-
Hill Interamericana de México S.A de C.V. 505 p.

Freund, J., Manning, R., 1989. Estadística. Prentice Hall Hispanoamericana S.A. México,
México. 611 p.

Gutiérrez, D. 1982. Estadística Matemática. Editorial Publicaciones Reunidas S.A.


Barcelona España. 243 p.

Little, T. y Hills, J. 1976 Métodos estadísticos para la investigación en la agricultura.


TRILLAS México. 270 p.

Loetz, E. 1999. Metodología Estadística para determinar el tamaño de muestra. Seminario


Taller Instituto de Genética – Facultad de Medicina. UMSA. La Paz – Bolivia. 56 p.

Martínez, C. 1997. Estadística y Muestreo. ECOE Ediciones, Santa Fe de Bogotá, Colombia,


880 p.

Miller I., Freund J., Johnson R., 1992. Probabilidad y Estadística para Ingenieros. Prentice
Hall Hispanoamericana SA, México. 625 p.

Rodríguez del Ángel, J. 1991. Métodos de investigación pecuaria. Editorial TRILLAS. México.
280 p.

Rodríguez, T. 1998 Apuntes de clase de Bioestadística. Facultad de Agronomía, UMSA. La


Paz, Bolivia.

Spiegel, M. 1988. Estadística. McGraw-Hill.México. 357 p.

116
Juan José Vicente Rojas

TABLAS
Juan José Vicente Rojas

TABLA Nº 1. Áreas bajo la curva normal estandarizada

z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
0.0 0.0000 0.0040 0.0080 0.0120 0.0160 0.0199 0.0239 0.0279 0.0319 0.0359
0.1 0.0398 0.0438 0.0478 0.0517 0.0557 0.0596 0.0636 0.0675 0.0714 0.0753
0.2 0.0793 0.0832 0.0871 0.0910 0.0948 0.0987 0.1026 0.1064 0.1103 0.1141
0.3 0.1179 0.1217 0.1255 0.1293 0.1331 0.1368 0.1406 0.1443 0.1480 0.1517
0.4 0.1554 0.1591 0.1628 0.1664 0.1700 0.1736 0.1772 0.1808 0.1844 0.1879
0.5 0.1915 0.1950 0.1985 0.2019 0.2054 0.2088 0.2123 0.2157 0.2190 0.2224
0.6 0.2257 0.2291 0.2324 0.2357 0.2389 0.2422 0.2454 0.2486 0.2517 0.2549
0.7 0.2580 0.2611 0.2642 0.2673 0.2704 0.2734 0.2764 0.2794 0.2823 0.2852
0.8 0.2881 0.2910 0.2939 0.2967 0.2995 0.3023 0.3051 0.3078 0.3106 0.3133
0.9 0.3159 0.3186 0.3212 0.3238 0.3264 0.3289 0.3315 0.3340 0.3365 0.3389
1.0 0.3413 0.3438 0.3461 0.3485 0.3508 0.3531 0.3554 0.3577 0.3599 0.3621
1.1 0.3643 0.3665 0.3686 0.3708 0.3729 0.3749 0.3770 0.3790 0.3810 0.3830
1.2 0.3849 0.3869 0.3888 0.3907 0.3925 0.3944 0.3962 0.3980 0.3997 0.4015
1.3 0.4032 0.4049 0.4066 0.4082 0.4099 0.4115 0.4131 0.4147 0.4162 0.4177
1.4 0.4192 0.4207 0.4222 0.4236 0.4251 0.4265 0.4279 0.4292 0.4306 0.4319
1.5 0.4332 0.4345 0.4357 0.4370 0.4382 0.4394 0.4406 0.4418 0.4429 0.4441
1.6 0.4452 0.4463 0.4474 0.4484 0.4495 0.4505 0.4515 0.4525 0.4535 0.4545
1.7 0.4554 0.4564 0.4573 0.4582 0.4591 0.4599 0.4608 0.4616 0.4625 0.4633
1.8 0.4641 0.4649 0.4656 0.4664 0.4671 0.4678 0.4686 0.4693 0.4699 0.4706
1.9 0.4713 0.4719 0.4726 0.4732 0.4738 0.4744 0.4750 0.4756 0.4761 0.4767
2.0 0.4772 0.4778 0.4783 0.4788 0.4793 0.4798 0.4803 0.4808 0.4812 0.4817
2.1 0.4821 0.4826 0.4830 0.4834 0.4838 0.4842 0.4846 0.4850 0.4854 0.4857
2.2 0.4861 0.4864 0.4868 0.4871 0.4875 0.4878 0.4881 0.4884 0.4887 0.4890
2.3 0.4893 0.4896 0.4898 0.4901 0.4904 0.4906 0.4909 0.4911 0.4913 0.4916
2.4 0.4918 0.4920 0.4922 0.4925 0.4927 0.4929 0.4931 0.4932 0.4934 0.4936
2.5 0.4938 0.4940 0.4941 0.4943 0.4945 0.4946 0.4948 0.4949 0.4951 0.4952
2.6 0.4953 0.4955 0.4956 0.4957 0.4959 0.4960 0.4961 0.4962 0.4963 0.4964
2.7 0.4965 0.4966 0.4967 0.4968 0.4969 0.4970 0.4971 0.4972 0.4973 0.4974
2.8 0.4974 0.4975 0.4976 0.4977 0.4977 0.4978 0.4979 0.4979 0.4980 0.4981
2.9 0.4981 0.4982 0.4982 0.4983 0.4984 0.4984 0.4985 0.4985 0.4986 0.4986
3.0 0.4987 0.4987 0.4987 0.4988 0.4988 0.4989 0.4989 0.4989 0.4990 0.4990
3.1 0.4990 0.4991 0.4991 0.4991 0.4992 0.4992 0.4992 0.4992 0.4993 0.4993
3.2 0.4993 0.4993 0.4994 0.4994 0.4994 0.4994 0.4994 0.4995 0.4995 0.4995
3.3 0.4995 0.4995 0.4995 0.4996 0.4996 0.4996 0.4996 0.4996 0.4996 0.4997
3.4 0.4997 0.4997 0.4997 0.4997 0.4997 0.4997 0.4997 0.4997 0.4997 0.4998
3.5 0.4998 0.4998 0.4998 0.4998 0.4998 0.4998 0.4998 0.4998 0.4998 0.4998
Juan José Vicente Rojas

Tabla Nº 2. Percentiles de la distribución estudentizada

Probabilidad de un valor más alto de t (2 colas)


gl 0.5 0.4 0.3 0.2 0.10 0.05 0.02 0.01 0.001
1 1.000 1.376 1.963 3.078 6.314 12.706 31.821 63.656 636.578
2 0.816 1.061 1.386 1.886 2.920 4.303 6.965 9.925 31.600
3 0.765 0.978 1.250 1.638 2.353 3.182 4.541 5.841 12.924
4 0.741 0.941 1.190 1.533 2.132 2.776 3.747 4.604 8.610
5 0.727 0.920 1.156 1.476 2.015 2.571 3.365 4.032 6.869
6 0.718 0.906 1.134 1.440 1.943 2.447 3.143 3.707 5.959
7 0.711 0.896 1.119 1.415 1.895 2.365 2.998 3.499 5.408
8 0.706 0.889 1.108 1.397 1.860 2.306 2.896 3.355 5.041
9 0.703 0.883 1.100 1.383 1.833 2.262 2.821 3.250 4.781
10 0.700 0.879 1.093 1.372 1.812 2.228 2.764 3.169 4.587
11 0.697 0.876 1.088 1.363 1.796 2.201 2.718 3.106 4.437
12 0.695 0.873 1.083 1.356 1.782 2.179 2.681 3.055 4.318
13 0.694 0.870 1.079 1.350 1.771 2.160 2.650 3.012 4.221
14 0.692 0.868 1.076 1.345 1.761 2.145 2.624 2.977 4.140
15 0.691 0.866 1.074 1.341 1.753 2.131 2.602 2.947 4.073
16 0.690 0.865 1.071 1.337 1.746 2.120 2.583 2.921 4.015
17 0.689 0.863 1.069 1.333 1.740 2.110 2.567 2.898 3.965
18 0.688 0.862 1.067 1.330 1.734 2.101 2.552 2.878 3.922
19 0.688 0.861 1.066 1.328 1.729 2.093 2.539 2.861 3.883
20 0.687 0.860 1.064 1.325 1.725 2.086 2.528 2.845 3.850
21 0.686 0.859 1.063 1.323 1.721 2.080 2.518 2.831 3.819
22 0.686 0.858 1.061 1.321 1.717 2.074 2.508 2.819 3.792
23 0.685 0.858 1.060 1.319 1.714 2.069 2.500 2.807 3.768
24 0.685 0.857 1.059 1.318 1.711 2.064 2.492 2.797 3.745
25 0.684 0.856 1.058 1.316 1.708 2.060 2.485 2.787 3.725
26 0.684 0.856 1.058 1.315 1.706 2.056 2.479 2.779 3.707
27 0.684 0.855 1.057 1.314 1.703 2.052 2.473 2.771 3.689
28 0.683 0.855 1.056 1.313 1.701 2.048 2.467 2.763 3.674
29 0.683 0.854 1.055 1.311 1.699 2.045 2.462 2.756 3.660
30 0.683 0.854 1.055 1.310 1.697 2.042 2.457 2.750 3.646
32 0.682 0.853 1.054 1.309 1.694 2.037 2.449 2.738 3.622
34 0.682 0.852 1.052 1.307 1.691 2.032 2.441 2.728 3.601
36 0.681 0.852 1.052 1.306 1.688 2.028 2.434 2.719 3.582
38 0.681 0.851 1.051 1.304 1.686 2.024 2.429 2.712 3.566
40 0.681 0.851 1.050 1.303 1.684 2.021 2.423 2.704 3.551
50 0.679 0.849 1.047 1.299 1.676 2.009 2.403 2.678 3.496
60 0.679 0.848 1.045 1.296 1.671 2.000 2.390 2.660 3.460
120 0.677 0.845 1.041 1.289 1.658 1.980 2.358 2.617 3.373
inf 0.674 0.842 1.036 1.282 1.645 1.960 2.336 2.576 3.291
gl 0.25 0.2 0.15 0.1 0.05 0.025 0.01 0.005 0.0005
Probabilidad de un valor positivo más alto de t (1 cola)
Juan José Vicente Rojas

Tabla Nº 3. Percentiles de la distribución Chi cuadrada ( χ2 )

Valores críticos de la distribución ji-cuadrada (cola superior)


alpha
gl 0.995 0.99 0.975 0.95 0.90 0.10 0.05 0.025 0.01 0.005
1 3.93E-05 0.00016 0.000982 0.00393 0.0158 2.706 3.84 5.02 6.63 7.88
2 0.010 0.0201 0.0506 0.103 0.211 4.61 5.99 7.38 9.21 10.60
3 0.072 0.115 0.216 0.352 0.584 6.25 7.81 9.35 11.34 12.84
4 0.207 0.297 0.484 0.711 1.064 7.78 9.49 11.14 13.28 14.86

5 0.412 0.554 0.831 1.145 1.610 9.24 11.07 12.83 15.09 16.75
6 0.676 0.872 1.237 1.64 2.20 10.64 12.59 14.45 16.81 18.55
7 0.989 1.239 1.690 2.17 2.83 12.02 14.07 16.01 18.48 20.28
8 1.34 1.65 2.18 2.73 3.49 13.36 15.51 17.53 20.09 21.95
9 1.73 2.09 2.70 3.33 4.17 14.68 16.92 19.02 21.67 23.59

10 2.16 2.56 3.25 3.94 4.87 15.99 18.31 20.48 23.21 25.19
11 2.60 3.05 3.82 4.57 5.58 17.28 19.68 21.92 24.73 26.76
12 3.07 3.57 4.40 5.23 6.30 18.55 21.03 23.34 26.22 28.30
13 3.57 4.11 5.01 5.89 7.04 19.81 22.36 24.74 27.69 29.82
14 4.07 4.66 5.63 6.57 7.79 21.06 23.68 26.12 29.14 31.32

15 4.60 5.23 6.26 7.26 8.55 22.31 25.00 27.49 30.58 32.80
16 5.14 5.81 6.91 7.96 9.31 23.54 26.30 28.85 32.00 34.27
17 5.70 6.41 7.56 8.67 10.09 24.77 27.59 30.19 33.41 35.72
18 6.26 7.01 8.23 9.39 10.86 25.99 28.87 31.53 34.81 37.16
19 6.84 7.63 8.91 10.12 11.65 27.20 30.14 32.85 36.19 38.58

20 7.43 8.26 9.59 10.85 12.44 28.41 31.41 34.17 37.57 40.00
21 8.03 8.90 10.28 11.59 13.24 29.62 32.67 35.48 38.93 41.40
22 8.64 9.54 10.98 12.34 14.04 30.81 33.92 36.78 40.29 42.80
23 9.26 10.20 11.69 13.09 14.85 32.01 35.17 38.08 41.64 44.18
24 9.89 10.86 12.40 13.85 15.66 33.20 36.42 39.36 42.98 45.56

25 10.52 11.52 13.12 14.61 16.47 34.38 37.65 40.65 44.31 46.93
26 11.16 12.20 13.84 15.38 17.29 35.56 38.89 41.92 45.64 48.29
27 11.81 12.88 14.57 16.15 18.11 36.74 40.11 43.19 46.96 49.65
28 12.46 13.56 15.31 16.93 18.94 37.92 41.34 44.46 48.28 50.99
29 13.12 14.26 16.05 17.71 19.77 39.09 42.56 45.72 49.59 52.34

30 13.79 14.95 16.79 18.49 20.60 40.26 43.77 46.98 50.89 53.67
40 20.71 22.16 24.43 26.51 29.05 51.81 55.76 59.34 63.69 66.77
60 35.53 37.48 40.48 43.19 46.46 74.40 79.08 83.30 88.38 91.95
70 43.28 45.44 48.76 51.74 55.33 85.53 90.53 95.02 100.43 104.21
80 51.17 53.54 57.15 60.39 64.28 96.58 101.88 106.63 112.33 116.32
90 59.20 61.75 65.65 69.13 73.29 107.57 113.15 118.14 124.12 128.30
100 67.33 70.06 74.22 77.93 82.36 118.50 124.34 129.56 135.81 140.17
Juan José Vicente Rojas
Tabla Nº 4. Distribución de F

Las cifras en caracteres finos corresponden a un riesgo de α = 0.05


Las cifras en caracteres gruesos corresponden a un riesgo de α = 0.01

GL Grados de libertad v1
V2 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 25 30 50 100 ∞
1 161 199 216 225 230 234 237 239 241 242 243 244 245 245 246 246 247 247 248 248 249 250 252 253 254
4052 4999 5404 5624 5764 5859 5928 5981 6022 6056 6083 6107 6126 6143 6157 6170 6181 6191 6201 6209 6240 6260 6302 6334 6366

2 18.51 19.00 19.16 19.25 19.30 19.33 19.35 19.37 19.38 19.40 19.40 19.41 19.42 19.42 19.43 19.43 19.44 19.44 19.44 19.45 19.46 19.46 19.48 19.49 19.50
98.50 99.00 99.16 99.25 99.30 99.33 99.36 99.38 99.39 99.40 99.41 99.42 99.42 99.43 99.43 99.44 99.44 99.44 99.45 99.45 99.46 99.47 99.48 99.49 99.50

3 10.13 9.55 9.28 9.12 9.01 8.94 8.89 8.85 8.81 8.79 8.76 8.74 8.73 8.71 8.70 8.69 8.68 8.67 8.67 8.66 8.63 8.62 8.58 8.55 8.53
34.12 30.82 29.46 28.71 28.24 27.91 27.67 27.49 27.34 27.23 27.13 27.05 26.98 26.92 26.87 26.83 26.79 26.75 26.72 26.69 26.58 26.50 26.35 26.24 26.13

4 7.71 6.94 6.59 6.39 6.26 6.16 6.09 6.04 6.00 5.96 5.94 5.91 5.89 5.87 5.86 5.84 5.83 5.82 5.81 5.80 5.77 5.75 5.70 5.66 5.63
21.20 18.00 16.69 15.98 15.52 15.21 14.98 14.80 14.66 14.55 14.45 14.37 14.31 14.25 14.20 14.15 14.11 14.08 14.05 14.02 13.91 13.84 13.69 13.58 13.46

5 6.61 5.79 5.41 5.19 5.05 4.95 4.88 4.82 4.77 4.74 4.70 4.68 4.66 4.64 4.62 4.60 4.59 4.58 4.57 4.56 4.52 4.50 4.44 4.41 4.36
16.26 13.27 12.06 11.39 10.97 10.67 10.46 10.29 10.16 10.05 9.96 9.89 9.82 9.77 9.72 9.68 9.64 9.61 9.58 9.55 9.45 9.38 9.24 9.13 9.02

6 5.99 5.14 4.76 4.53 4.39 4.28 4.21 4.15 4.10 4.06 4.03 4.00 3.98 3.96 3.94 3.92 3.91 3.90 3.88 3.87 3.83 3.81 3.75 3.71 3.67
13.75 10.92 9.78 9.15 8.75 8.47 8.26 8.10 7.98 7.87 7.79 7.72 7.66 7.60 7.56 7.52 7.48 7.45 7.42 7.40 7.30 7.23 7.09 6.99 6.88

7 5.59 4.74 4.35 4.12 3.97 3.87 3.79 3.73 3.68 3.64 3.60 3.57 3.55 3.53 3.51 3.49 3.48 3.47 3.46 3.44 3.40 3.38 3.32 3.27 3.23
12.25 9.55 8.45 7.85 7.46 7.19 6.99 6.84 6.72 6.62 6.54 6.47 6.41 6.36 6.31 6.28 6.24 6.21 6.18 6.16 6.06 5.99 5.86 5.75 5.65

8 5.32 4.46 4.07 3.84 3.69 3.58 3.50 3.44 3.39 3.35 3.31 3.28 3.26 3.24 3.22 3.20 3.19 3.17 3.16 3.15 3.11 3.08 3.02 2.97 2.93
11.26 8.65 7.59 7.01 6.63 6.37 6.18 6.03 5.91 5.81 5.73 5.67 5.61 5.56 5.52 5.48 5.44 5.41 5.38 5.36 5.26 5.20 5.07 4.96 4.86

9 5.12 4.26 3.86 3.63 3.48 3.37 3.29 3.23 3.18 3.14 3.10 3.07 3.05 3.03 3.01 2.99 2.97 2.96 2.95 2.94 2.89 2.86 2.80 2.76 2.71
10.56 8.02 6.99 6.42 6.06 5.80 5.61 5.47 5.35 5.26 5.18 5.11 5.05 5.01 4.96 4.92 4.89 4.86 4.83 4.81 4.71 4.65 4.52 4.41 4.31

10 4.96 4.10 3.71 3.48 3.33 3.22 3.14 3.07 3.02 2.98 2.94 2.91 2.89 2.86 2.85 2.83 2.81 2.80 2.79 2.77 2.73 2.70 2.64 2.59 2.54
10.04 7.56 6.55 5.99 5.64 5.39 5.20 5.06 4.94 4.85 4.77 4.71 4.65 4.60 4.56 4.52 4.49 4.46 4.43 4.41 4.31 4.25 4.12 4.01 3.91

11 4.844 3.982 3.587 3.357 3.204 3.095 3.012 2.948 2.896 2.854 2.818 2.788 2.761 2.739 2.719 2.701 2.685 2.671 2.658 2.646 2.601 2.570 2.507 2.457 2.404
9.646 7.206 6.217 5.668 5.316 5.069 4.886 4.744 4.632 4.539 4.462 4.397 4.342 4.293 4.251 4.213 4.180 4.150 4.123 4.099 4.005 3.941 3.810 3.708 3.602

12 4.75 3.89 3.49 3.26 3.11 3.00 2.91 2.85 2.80 2.75 2.72 2.69 2.66 2.64 2.62 2.60 2.58 2.57 2.56 2.54 2.50 2.47 2.40 2.35 2.30
9.33 6.93 5.95 5.41 5.06 4.82 4.64 4.50 4.39 4.30 4.22 4.16 4.10 4.05 4.01 3.97 3.94 3.91 3.88 3.86 3.76 3.70 3.57 3.47 3.36

13 4.67 3.81 3.41 3.18 3.03 2.92 2.83 2.77 2.71 2.67 2.63 2.60 2.58 2.55 2.53 2.51 2.50 2.48 2.47 2.46 2.41 2.38 2.31 2.26 2.21
9.07 6.70 5.74 5.21 4.86 4.62 4.44 4.30 4.19 4.10 4.02 3.96 3.91 3.86 3.82 3.78 3.75 3.72 3.69 3.66 3.57 3.51 3.38 3.27 3.17

14 4.60 3.74 3.34 3.11 2.96 2.85 2.76 2.70 2.65 2.60 2.57 2.53 2.51 2.48 2.46 2.44 2.43 2.41 2.40 2.39 2.34 2.31 2.24 2.19 2.13
8.86 6.51 5.56 5.04 4.69 4.46 4.28 4.14 4.03 3.94 3.86 3.80 3.75 3.70 3.66 3.62 3.59 3.56 3.53 3.51 3.41 3.35 3.22 3.11 3.00

15 4.54 3.68 3.29 3.06 2.90 2.79 2.71 2.64 2.59 2.54 2.51 2.48 2.45 2.42 2.40 2.38 2.37 2.35 2.34 2.33 2.28 2.25 2.18 2.12 2.07
8.68 6.36 5.42 4.89 4.56 4.32 4.14 4.00 3.89 3.80 3.73 3.67 3.61 3.56 3.52 3.49 3.45 3.42 3.40 3.37 3.28 3.21 3.08 2.98 2.87

16 4.49 3.63 3.24 3.01 2.85 2.74 2.66 2.59 2.54 2.49 2.46 2.42 2.40 2.37 2.35 2.33 2.32 2.30 2.29 2.28 2.23 2.19 2.12 2.07 2.01
8.53 6.23 5.29 4.77 4.44 4.20 4.03 3.89 3.78 3.69 3.62 3.55 3.50 3.45 3.41 3.37 3.34 3.31 3.28 3.26 3.16 3.10 2.97 2.86 2.75

17 4.45 3.59 3.20 2.96 2.81 2.70 2.61 2.55 2.49 2.45 2.41 2.38 2.35 2.33 2.31 2.29 2.27 2.26 2.24 2.23 2.18 2.15 2.08 2.02 1.96
8.40 6.11 5.19 4.67 4.34 4.10 3.93 3.79 3.68 3.59 3.52 3.46 3.40 3.35 3.31 3.27 3.24 3.21 3.19 3.16 3.07 3.00 2.87 2.76 2.65

18 4.41 3.55 3.16 2.93 2.77 2.66 2.58 2.51 2.46 2.41 2.37 2.34 2.31 2.29 2.27 2.25 2.23 2.22 2.20 2.19 2.14 2.11 2.04 1.98 1.92
8.29 6.01 5.09 4.58 4.25 4.01 3.84 3.71 3.60 3.51 3.43 3.37 3.32 3.27 3.23 3.19 3.16 3.13 3.10 3.08 2.98 2.92 2.78 2.68 2.57

19 4.38 3.52 3.13 2.90 2.74 2.63 2.54 2.48 2.42 2.38 2.34 2.31 2.28 2.26 2.23 2.21 2.20 2.18 2.17 2.16 2.11 2.07 2.00 1.94 1.88
8.18 5.93 5.01 4.50 4.17 3.94 3.77 3.63 3.52 3.43 3.36 3.30 3.24 3.19 3.15 3.12 3.08 3.05 3.03 3.00 2.91 2.84 2.71 2.60 2.49

20 4.35 3.49 3.10 2.87 2.71 2.60 2.51 2.45 2.39 2.35 2.31 2.28 2.25 2.22 2.20 2.18 2.17 2.15 2.14 2.12 2.07 2.04 1.97 1.91 1.84
8.10 5.85 4.94 4.43 4.10 3.87 3.70 3.56 3.46 3.37 3.29 3.23 3.18 3.13 3.09 3.05 3.02 2.99 2.96 2.94 2.84 2.78 2.64 2.54 2.42

21 4.3 3.5 3.1 2.8 2.7 2.6 2.5 2.4 2.4 2.3 2.3 2.3 2.2 2.2 2.2 2.2 2.1 2.1 2.1 2.1 2.0 2.0 1.9 1.9 1.8
8.0 5.8 4.9 4.4 4.0 3.8 3.6 3.5 3.4 3.3 3.2 3.2 3.1 3.1 3.0 3.0 3.0 2.9 2.9 2.9 2.8 2.7 2.6 2.5 2.4

22 4.30 3.44 3.05 2.82 2.66 2.55 2.46 2.40 2.34 2.30 2.26 2.23 2.20 2.17 2.15 2.13 2.11 2.10 2.08 2.07 2.02 1.98 1.91 1.85 1.78
7.95 5.72 4.82 4.31 3.99 3.76 3.59 3.45 3.35 3.26 3.18 3.12 3.07 3.02 2.98 2.94 2.91 2.88 2.85 2.83 2.73 2.67 2.53 2.42 2.31

23 4.28 3.42 3.03 2.80 2.64 2.53 2.44 2.37 2.32 2.27 2.24 2.20 2.18 2.15 2.13 2.11 2.09 2.08 2.06 2.05 2.00 1.96 1.88 1.82 1.76
7.88 5.66 4.76 4.26 3.94 3.71 3.54 3.41 3.30 3.21 3.14 3.07 3.02 2.97 2.93 2.89 2.86 2.83 2.80 2.78 2.69 2.62 2.48 2.37 2.26

24 4.26 3.40 3.01 2.78 2.62 2.51 2.42 2.36 2.30 2.25 2.22 2.18 2.15 2.13 2.11 2.09 2.07 2.05 2.04 2.03 1.97 1.94 1.86 1.80 1.73
7.82 5.61 4.72 4.22 3.90 3.67 3.50 3.36 3.26 3.17 3.09 3.03 2.98 2.93 2.89 2.85 2.82 2.79 2.76 2.74 2.64 2.58 2.44 2.33 2.21
Juan José Vicente Rojas

Distribución de F (continuación)
Grados de libertad v1
GL 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 25 30 50 100 ∞
V2
25 4.24 3.39 2.99 2.76 2.60 2.49 2.40 2.34 2.28 2.24 2.20 2.16 2.14 2.11 2.09 2.07 2.05 2.04 2.02 2.01 1.96 1.92 1.84 1.78 1.71
7.77 5.57 4.68 4.18 3.85 3.63 3.46 3.32 3.22 3.13 3.06 2.99 2.94 2.89 2.85 2.81 2.78 2.75 2.72 2.70 2.60 2.54 2.40 2.29 2.17

26 4.23 3.37 2.98 2.74 2.59 2.47 2.39 2.32 2.27 2.22 2.18 2.15 2.12 2.09 2.07 2.05 2.03 2.02 2.00 1.99 1.94 1.90 1.82 1.76 1.69
7.72 5.53 4.64 4.14 3.82 3.59 3.42 3.29 3.18 3.09 3.02 2.96 2.90 2.86 2.81 2.78 2.75 2.72 2.69 2.66 2.57 2.50 2.36 2.25 2.13

27 4.21 3.35 2.96 2.73 2.57 2.46 2.37 2.31 2.25 2.20 2.17 2.13 2.10 2.08 2.06 2.04 2.02 2.00 1.99 1.97 1.92 1.88 1.81 1.74 1.67
7.68 5.49 4.60 4.11 3.78 3.56 3.39 3.26 3.15 3.06 2.99 2.93 2.87 2.82 2.78 2.75 2.71 2.68 2.66 2.63 2.54 2.47 2.33 2.22 2.10

28 4.20 3.34 2.95 2.71 2.56 2.45 2.36 2.29 2.24 2.19 2.15 2.12 2.09 2.06 2.04 2.02 2.00 1.99 1.97 1.96 1.91 1.87 1.79 1.73 1.65
7.64 5.45 4.57 4.07 3.75 3.53 3.36 3.23 3.12 3.03 2.96 2.90 2.84 2.79 2.75 2.72 2.68 2.65 2.63 2.60 2.51 2.44 2.30 2.19 2.06

29 4.18 3.33 2.93 2.70 2.55 2.43 2.35 2.28 2.22 2.18 2.14 2.10 2.08 2.05 2.03 2.01 1.99 1.97 1.96 1.94 1.89 1.85 1.77 1.71 1.64
7.60 5.42 4.54 4.04 3.73 3.50 3.33 3.20 3.09 3.00 2.93 2.87 2.81 2.77 2.73 2.69 2.66 2.63 2.60 2.57 2.48 2.41 2.27 2.16 2.03

30 4.17 3.32 2.92 2.69 2.53 2.42 2.33 2.27 2.21 2.16 2.13 2.09 2.06 2.04 2.01 1.99 1.98 1.96 1.95 1.93 1.88 1.84 1.76 1.70 1.62
7.56 5.39 4.51 4.02 3.70 3.47 3.30 3.17 3.07 2.98 2.91 2.84 2.79 2.74 2.70 2.66 2.63 2.60 2.57 2.55 2.45 2.39 2.25 2.13 2.01

32 4.15 3.29 2.90 2.67 2.51 2.40 2.31 2.24 2.19 2.14 2.10 2.07 2.04 2.01 1.99 1.97 1.95 1.94 1.92 1.91 1.85 1.82 1.74 1.67 1.59
7.50 5.34 4.46 3.97 3.65 3.43 3.26 3.13 3.02 2.93 2.86 2.80 2.74 2.70 2.65 2.62 2.58 2.55 2.53 2.50 2.41 2.34 2.20 2.08 1.96

34 4.13 3.28 2.88 2.65 2.49 2.38 2.29 2.23 2.17 2.12 2.08 2.05 2.02 1.99 1.97 1.95 1.93 1.92 1.90 1.89 1.83 1.80 1.71 1.65 1.57
7.44 5.29 4.42 3.93 3.61 3.39 3.22 3.09 2.98 2.89 2.82 2.76 2.70 2.66 2.61 2.58 2.54 2.51 2.49 2.46 2.37 2.30 2.16 2.04 1.91

36 4.11 3.26 2.87 2.63 2.48 2.36 2.28 2.21 2.15 2.11 2.07 2.03 2.00 1.98 1.95 1.93 1.92 1.90 1.88 1.87 1.81 1.78 1.69 1.62 1.55
7.40 5.25 4.38 3.89 3.57 3.35 3.18 3.05 2.95 2.86 2.79 2.72 2.67 2.62 2.58 2.54 2.51 2.48 2.45 2.43 2.33 2.26 2.12 2.00 1.87

38 4.10 3.24 2.85 2.62 2.46 2.35 2.26 2.19 2.14 2.09 2.05 2.02 1.99 1.96 1.94 1.92 1.90 1.88 1.87 1.85 1.80 1.76 1.68 1.61 1.53
7.35 5.21 4.34 3.86 3.54 3.32 3.15 3.02 2.92 2.83 2.75 2.69 2.64 2.59 2.55 2.51 2.48 2.45 2.42 2.40 2.30 2.23 2.09 1.97 1.84

40 4.08 3.23 2.84 2.61 2.45 2.34 2.25 2.18 2.12 2.08 2.04 2.00 1.97 1.95 1.92 1.90 1.89 1.87 1.85 1.84 1.78 1.74 1.66 1.59 1.51
7.31 5.18 4.31 3.83 3.51 3.29 3.12 2.99 2.89 2.80 2.73 2.66 2.61 2.56 2.52 2.48 2.45 2.42 2.39 2.37 2.27 2.20 2.06 1.94 1.80

42 4.07 3.22 2.83 2.59 2.44 2.32 2.24 2.17 2.11 2.06 2.03 1.99 1.96 1.94 1.91 1.89 1.87 1.86 1.84 1.83 1.77 1.73 1.65 1.57 1.49
7.28 5.15 4.29 3.80 3.49 3.27 3.10 2.97 2.86 2.78 2.70 2.64 2.59 2.54 2.50 2.46 2.43 2.40 2.37 2.34 2.25 2.18 2.03 1.91 1.78

44 4.06 3.21 2.82 2.58 2.43 2.31 2.23 2.16 2.10 2.05 2.01 1.98 1.95 1.92 1.90 1.88 1.86 1.84 1.83 1.81 1.76 1.72 1.63 1.56 1.48
7.25 5.12 4.26 3.78 3.47 3.24 3.08 2.95 2.84 2.75 2.68 2.62 2.56 2.52 2.47 2.44 2.40 2.37 2.35 2.32 2.22 2.15 2.01 1.89 1.75

46 4.05 3.20 2.81 2.57 2.42 2.30 2.22 2.15 2.09 2.04 2.00 1.97 1.94 1.91 1.89 1.87 1.85 1.83 1.82 1.80 1.75 1.71 1.62 1.55 1.46
7.22 5.10 4.24 3.76 3.44 3.22 3.06 2.93 2.82 2.73 2.66 2.60 2.54 2.50 2.45 2.42 2.38 2.35 2.33 2.30 2.20 2.13 1.99 1.86 1.73

48 4.04 3.19 2.80 2.57 2.41 2.29 2.21 2.14 2.08 2.03 1.99 1.96 1.93 1.90 1.88 1.86 1.84 1.82 1.81 1.79 1.74 1.70 1.61 1.54 1.45
7.19 5.08 4.22 3.74 3.43 3.20 3.04 2.91 2.80 2.71 2.64 2.58 2.53 2.48 2.44 2.40 2.37 2.33 2.31 2.28 2.18 2.12 1.97 1.84 1.70

50 4.03 3.18 2.79 2.56 2.40 2.29 2.20 2.13 2.07 2.03 1.99 1.95 1.92 1.89 1.87 1.85 1.83 1.81 1.80 1.78 1.73 1.69 1.60 1.52 1.44
7.17 5.06 4.20 3.72 3.41 3.19 3.02 2.89 2.78 2.70 2.63 2.56 2.51 2.46 2.42 2.38 2.35 2.32 2.29 2.27 2.17 2.10 1.95 1.82 1.68

55 4.02 3.16 2.77 2.54 2.38 2.27 2.18 2.11 2.06 2.01 1.97 1.93 1.90 1.88 1.85 1.83 1.81 1.79 1.78 1.76 1.71 1.67 1.58 1.50 1.41
7.12 5.01 4.16 3.68 3.37 3.15 2.98 2.85 2.75 2.66 2.59 2.53 2.47 2.42 2.38 2.34 2.31 2.28 2.25 2.23 2.13 2.06 1.91 1.78 1.64

60 4.00 3.15 2.76 2.53 2.37 2.25 2.17 2.10 2.04 1.99 1.95 1.92 1.89 1.86 1.84 1.82 1.80 1.78 1.76 1.75 1.69 1.65 1.56 1.48 1.39
7.08 4.98 4.13 3.65 3.34 3.12 2.95 2.82 2.72 2.63 2.56 2.50 2.44 2.39 2.35 2.31 2.28 2.25 2.22 2.20 2.10 2.03 1.88 1.75 1.60

65 3.99 3.14 2.75 2.51 2.36 2.24 2.15 2.08 2.03 1.98 1.94 1.90 1.87 1.85 1.82 1.80 1.78 1.76 1.75 1.73 1.68 1.63 1.54 1.46 1.37
7.04 4.95 4.10 3.62 3.31 3.09 2.93 2.80 2.69 2.61 2.53 2.47 2.42 2.37 2.33 2.29 2.26 2.23 2.20 2.17 2.07 2.00 1.85 1.72 1.57

70 3.98 3.13 2.74 2.50 2.35 2.23 2.14 2.07 2.02 1.97 1.93 1.89 1.86 1.84 1.81 1.79 1.77 1.75 1.74 1.72 1.66 1.62 1.53 1.45 1.35
7.01 4.92 4.07 3.60 3.29 3.07 2.91 2.78 2.67 2.59 2.51 2.45 2.40 2.35 2.31 2.27 2.23 2.20 2.18 2.15 2.05 1.98 1.83 1.70 1.54

80 3.96 3.11 2.72 2.49 2.33 2.21 2.13 2.06 2.00 1.95 1.91 1.88 1.84 1.82 1.79 1.77 1.75 1.73 1.72 1.70 1.64 1.60 1.51 1.43 1.32
6.96 4.88 4.04 3.56 3.26 3.04 2.87 2.74 2.64 2.55 2.48 2.42 2.36 2.31 2.27 2.23 2.20 2.17 2.14 2.12 2.01 1.94 1.79 1.65 1.49

100 3.94 3.09 2.70 2.46 2.31 2.19 2.10 2.03 1.97 1.93 1.89 1.85 1.82 1.79 1.77 1.75 1.73 1.71 1.69 1.68 1.62 1.57 1.48 1.39 1.28
6.90 4.82 3.98 3.51 3.21 2.99 2.82 2.69 2.59 2.50 2.43 2.37 2.31 2.27 2.22 2.19 2.15 2.12 2.09 2.07 1.97 1.89 1.74 1.60 1.43

125 3.92 3.07 2.68 2.44 2.29 2.17 2.08 2.01 1.96 1.91 1.87 1.83 1.80 1.77 1.75 1.73 1.71 1.69 1.67 1.66 1.59 1.55 1.45 1.36 1.25
6.84 4.78 3.94 3.47 3.17 2.95 2.79 2.66 2.55 2.47 2.39 2.33 2.28 2.23 2.19 2.15 2.11 2.08 2.05 2.03 1.93 1.85 1.69 1.55 1.37

150 3.90 3.06 2.66 2.43 2.27 2.16 2.07 2.00 1.94 1.89 1.85 1.82 1.79 1.76 1.73 1.71 1.69 1.67 1.66 1.64 1.58 1.54 1.44 1.34 1.22
6.81 4.75 3.91 3.45 3.14 2.92 2.76 2.63 2.53 2.44 2.37 2.31 2.25 2.20 2.16 2.12 2.09 2.06 2.03 2.00 1.90 1.83 1.66 1.52 1.33

200 3.89 3.04 2.65 2.42 2.26 2.14 2.06 1.98 1.93 1.88 1.84 1.80 1.77 1.74 1.72 1.69 1.67 1.66 1.64 1.62 1.56 1.52 1.41 1.32 1.19
6.76 4.71 3.88 3.41 3.11 2.89 2.73 2.60 2.50 2.41 2.34 2.27 2.22 2.17 2.13 2.09 2.06 2.03 2.00 1.97 1.87 1.79 1.63 1.48 1.28

∞ 3.84 3.00 2.60 2.37 2.21 2.10 2.01 1.94 1.88 1.83 1.79 1.75 1.72 1.69 1.67 1.64 1.62 1.60 1.59 1.57 1.51 1.46 1.35 1.24 1.01
6.64 4.61 3.78 3.32 3.02 2.80 2.64 2.51 2.41 2.32 2.25 2.19 2.13 2.08 2.04 2.00 1.97 1.94 1.91 1.88 1.77 1.70 1.53 1.36 1.03
Juan José Vicente Rojas

También podría gustarte