Clase09 - Variables Aleatorias Continuas

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 56

DISTRIBUCIONES DE

PROBABILIDAD DE
VARIABLES ALEATORIAS
CONTINUAS
“Herramienta para la toma de decisiones.”

1
LA DISTRIBUCIÓN NORMAL
Función de Probabilidad
• La distribución normal, es una distribución 2
muy importante en el campo de la 1  r −u 
1 −  
P(X  x) = −
x 2 σ 
estadística aplicada. e dr
• Conocida también como curva de Gauss. σ 2π
• Es simétrica con respecto a U.

8
Para - <x<
• Es asintótica con respecto al eje X.
Parámetros: : Media Varianza
u σ2

Distribución Normal Estándar  x −u 


z = 
• La distribución normal estandar es una Función de Probabilidad   
distribución normal media u = 0 y varianza σ =
1. r2
1 −
P(Z  z) = −
z
• Tiene las mismas características de una e dr 2
distribución normal. 8 2π
8
Para - <z< ; Para z = -4, …,4

2
Distribución Normal
• Descubierta en 1733 por el francés Moiure, descrita
también por Laplace y Gauss (sinónimo de la forma
gráfica de esta distribución).
• Importancia práctica de esta distribución teórica:
– Muchos fenómenos distribuidos suficientemente Normal
que distribución es la base de gran parte de la teoría
estadística usada por los biólogos.
– Distribución de promedios.
– Distribución de errores.
Características D. Normal
• Área bajo la curva entre 2 puntos representa probabilidad que ocurra un
hecho entre esos dos puntos
• Su dominio va de menos infinito a más infinito;
• Es simétrica con respecto a su media;
• Tiene dos colas y es asintótica al eje x por ambos lados;
• El valor del área debajo de toda la curva es igual a 1;
• El centro de la curva está representado por la media poblacional ().
• Para cualquier curva normal, el área de - a + es igual a 0.6827; de -2 a
+2 de 0,9545 y de -3 a +3 de 0,9973;
• Distribución muestreal de varios estadísticos, como `x es normal e
independiente de distribución de la población.
D. Normal Tipificada (estandarizada)
• Distribución especial que representa a todas las variables aleatorias
normales y que es la distribución de otra variable normal llamada Z:

x -
Z=

• =NORMALIZACION(x;media;desv_estándar)
• Z se la conoce como variable aleatoria estandarizada.
• Esta función se caracteriza por tener media igual a cero y desviación
tipificada igual a uno : N(0,1)
• Representa a todas las distribuciones Normales. Igual densidad de
probabilidad, si medimos desviaciones de media en base a .
• Valores obtenidos de tabla Normal válidos para todas las distribuciones
Normal de media =  y varianza =2.
Densidad de Probabilidad
• N (0,1) y N( ,2)
Probabilidad Acumulada
• N (0,1) y N( ,2)
Tabla Distribución Z
=DISTR.NORM.ESTAND(Z)
Uso de Tabla Distribución Z
• Para determinar la probabilidad de ocurrencia de un suceso
entre 2 puntos debemos determinar el área bajo la curva entre
dichos puntos.
• Depende tipo de tabla. Usaremos tabla de - a X, ya que da la
probabilidad acumulada al igual que Excel.
• Existen otros tipos de tabla
– 0 a X, X a , etc.
– Debemos razonar siempre como determinar el área.
• En nuestra tabla, para determinar P(- a X) o P(Z ≤ X):
1. Buscamos en la columna izquierda de la tabla el valor del entero y
primer decimal
2. Buscamos en la fila superior el valor del segundo decimal,
3. Interceptamos ambos valores obteniendo el valor de P.
4. Interpretamos este valor
Probabilidad Normal Excel
=DISTR.NORM.ESTAND(Z)
• Devuelve la función de distribución normal estándar
acumulativa. La distribución tiene una media de 0 (cero) y una
desviación estándar de uno. Use esta función en lugar de una
tabla estándar de áreas de curvas normales
• Ejercicio 03 - DistribucionNormal.xlsx
Uso Tabla Normal Estándar (a)
Obtenga la probabilidad de que Z obtenga los siguientes valores:
• P (Z  1.17)
– Buscamos en la columna izquierda de la tabla el valor 1.1, y
en la primera fila el valor 0.07, interceptamos ambos
valores obteniendo el valor de 0.8790, que es el valor que
buscábamos:
P(Z  1.17) = 0.879
Uso Tabla Normal Estándar (b)
• P(0 Z  1.17)
– Esto lo podemos escribir de la siguiente forma también:
P(Z ≤1.17) - P(Z  0)
– El primer término lo conocemos, por que lo resolvimos en el literal a.
– Para el segundo término sabemos que la distribución normal es
simétrica y que su área total es igual a 1, por lo tanto el área que hay
de - a 0 (P(Z  0)) es igual a 1/2 = 0.5.
– Por lo que el valor que buscábamos estará dado por:
P(0≤ Z  1.17) = 0.879 - 0.5 = 0.379
Uso Tabla Normal Estándar (c)
• P(Z  1.17)
– Sabiendo que el área total bajo toda la curva Normal de - a + es
igual a 1, y conociendo el valor del área de - a 1.17, el valor del área
de 1.17 a + será:
1 - P(Z  1.17) = 1 - 0.879 = 0.121
Uso Tabla Normal Estándar (d)
• P(Z  -1.17)
– Como estamos tratando con una curva simétrica, este valor será el
mismo que el del literal c:
P(Z  -1.17) = P(Z  1.17) = 0.121
Uso Tabla Normal Estándar (e)
• P(0.42 Z  1.17)
– Al igual que en el literal b, esto lo podemos escribir como:
P(Z ≤1.17) - P(Z  0.42).
– El primer valor lo conocemos, el segundo lo encontramos en la tabla de la misma forma:
P( Z  1.17) – P(Z  0.42)= 0.879-0.6628= 0.2162
Uso Tabla Normal Estándar (f)
h) P(|Z|  1.17)
– Determinar el área de - a -1.17 y de 1.17 a +. Como la curva es simétrica,
simplemente multiplicamos el valor de P(Z  1.17) del literal c por 2:
P(|Z|  1.17) = 2 x P(Z  1.17) = 2 x 0.121 = 0.242
Uso Tabla Normal Estándar (g)
i) P(|Z|  1.17)
– Área dada por 1 menos valor literal h, ya que el valor total del área es igual a 1:
P(Z  1.17) = 1- P(Z 1.17) = 1 - 0.242 = 0.758
Tabla Distribución Z Inversa
• Otro caso diferente para el cual podemos utilizar la tabla es para
encontrar el valor de Z después del cual se encuentra un  x 100
% del área de la curva.
• Esto equivale a decir buscar el valor de Z cuya probabilidad de
ser mayor sea 100 x  %, o en su defecto que su probabilidad de
ser menor sea de (1-)x100 %
Inverso Normal Excel
• =DISTR.NORM.ESTAND.INV(probabilidad)
• Devuelve el inverso de la distribución normal estándar
acumulativa. Calcula el valor de Z en donde el área de la curva
a su izquierda es igual a la probabilidad buscada.
• Se calcula con base en iteraciones, y el grado de precisión
puede variar.
Inverso Tabla Normal(0,1) (a)
• Hallar el valor de Z antes del cual se encuentra el 0.879 del
área de la curva
– Buscamos en el cuerpo de la tabla el valor correspondiente
a 0.8790. Vemos en la columna que corresponde al valor
1.1, y en la primera fila el valor a 0.07, lo que nos da
Z(1-0.879)=1.17
Inverso Tabla Normal(0,1) (b)
• Hallar el valor de Z después del cual se encuentra el 5% del
área de la curva:
– Esto corresponde a un valor de  = 0.05
– Esto equivale a decir buscar el valor de Z tal que:
P(Z  x) = 0.05
– Buscamos en la tabla el valor de 1 - 0.05 = 0.95
– Este se encontraría en la fila correspondiente a 1.6, entre los valores
de las columnas 4 (0.9495) y 5 (0.9505), interpolamos 4.5, y Z sería
igual a 1.645.
Z(0.05) = 1.645
Inverso Tabla Normal(0,1) (c)
• Hallar el valor de Z tal que el área sobre el mas el área bajo -
Z sea igual a 0.05:
– Esto equivale a decir buscar el valor de Z tal que:
P(|Z|  x) = 0.05
– Como es una curva simétrica: /2 = 0.05/2=0.025
– Buscamos en la tabla el valor de 1 - 0.025 = 0.95
Z(0.025) = 1.96
Inverso Tabla Normal(0,1)
• (d) Hallar el valor de Z después del cual se encuentra el 1%
del área de la curva:
– Esto corresponde a un valor de  = 0.01
– En Excel =DISTR.NORM.ESTAND.INV(0.99)
Z(0.01) = 2.326

• (e) Hallar el valor de Z tal que el área sobre el mas el área


bajo -Z sea igual a 0.01:
– Como es una curva simétrica: /2 = 0.01/2=0.005
– En Excel =DISTR.NORM.ESTAND.INV(0.995)
Z(0.005) = 2.576
Buscar en la tabla para comprobar
Distribución Normal (, )
• Esto Ok! para curva N (0,1) pero y si queremos usarlo
en población natural con 0 y 1?
• No hay problema! Tipificamos valor de x en nuestra
distribución Normal con fórmula:
x -
Z=

• Y procedemos a buscar la probabilidad para este
valor determinado.
• Z no es más que el número de desviaciones
estándares a la que se encuentra x de .
Tipificar en Excel
• = NORMALIZACION(x,,)
– Valor normalizado de distribución caracterizada por los
argumentos media y desv_estándar : Z =(`x-)/
• =DISTR.NORM(x,,, Verdadero)
– Calcula probabilidad de que un valor se encuentre bajo x
en una distribución N(,): P(Z ≤ x)
• DISTR.NORM.INV(P, ,)
– Devuelve el valor x abajo del cual se encuentra el Px100%
del área de la curva para una distribución N(,).
Ejercicio
a) Encontrar la probabilidad que al muestrear una
piscina con una población Normal con peso =5g y
2=4 encontremos un valor > 7.78g.
– Como 2=4, entonces  = 2.
– Calculamos el valor de Z:
7.78 - 5
Z= = 1.39
2
– Y luego calculamos la probabilidad de que Z sea mayor a
este valor en la tabla:
P(Z  1.39) = 1-0.9177=0.0823
– En Excel lo podemos hacer directo o por pasos
b) En la misma piscina calcular entre que valores de
peso se encuentra el 95% de la población
Distribución Derivada
• Al muestrear repetidamente una población,
obtenemos distribución de sus `x.
• Distribución Derivada es Normal, independiente de
distribución de la Población.
•  de población de `x de tamaño n es igual a la  de
población original, y varianza es 1/n de varianza
poblacional :
`x =  2`x = 2/n
Distribucion de Medias
14%

12%

Teorema Central del Límite


10%
PROBABILITY

8%

6%

4%

2%

0%
4.0 6.0 8.0 10.0 12.0 14.0 16.0
Values

Dist. Deriv Dist. Pobl.


Distribucion de Medias
14%

12%

10%
PROBABILITY

8%

6%

4%

2%

0%
4.0 6.0 8.0 10.0 12.0 14.0 16.0
Values

Dist. Deriv Dist. Pobl.


Ejercicio
• Encontrar la probabilidad que al sacar una muestra
de tamaño n=16 de una población con =10 y 2=4
encontrar un promedio ≥ 11.
– `x es una muestra de población normal derivada con:
`x =  = 10 ; 2`x = 2/n = 4/16 = 1/4; `x = ½
– Buscamos distancia de nuestro promedio a la media:
x - x 11- 10
Z= = =2
x 1/ 2
– Buscando en la tabla: P(Z  2) = 0.228
• Por lo que podemos decir que la probabilidad de
sacar un muestreo de n = 16 y `x  11 es de 2.28%, lo
cual se considera “poco usual”.
Distribución “t” de Student
• Desarrollada con base en distribuciones de frecuencia
empíricas por William Gosset, (a) “Student”.
– “The probable error of a mean” Biometrika 1908
• Cervecero - estadístico con dificultadas al usar
distribución Normal en muestras pequeñas.
• Sin embargo fue Fisher el que encontró mas
aplicaciones para esta
Distribución “t” de Student
• Distribución muestreal del promedio se ajusta muy bien a la
distribución Normal cuando se conoce . Si n es grande, esto
no presenta ningún problema, aun cuando  sea desconocida,
por lo que en este caso es razonable sustituirla por s.
• Sin embargo, en el caso de usar valores de n < 30, o sea en el
caso de pequeñas muestras, esto no funciona tan bien.
Distribución “t” de Student
• Definiendo el estadístico t:
x -
t=
s/ n
• Se puede probar que siendo `x el promedio de una
muestra tomada de una población normal con media
 y varianza 2, el estadístico t es el valor de una
variable aleatoria con distribución "t" de Student y
parámetro  (grados de libertad) = n-1.
Características Distribución “t”
• Tiene media igual 0, es asintótica al eje x y su
dominio va de -  a +;
• El área bajo la curva desde - a + es igual a 1
•  = 0, 2 depende parámetro  (grados libertad)
• Varianza > 1, pero se aproxima a 1 cuando n
• Al aumentar n, la distribución “t se aproxima a la
Normal; n > 30 ó más, excelente aproximación
• Entre las aplicaciones:
– Estimación de intervalos de confianza para medias a partir
de muestras pequeñas
– Pruebas de hipótesis basadas en muestras < 30
Tabla de Distribución “t”
• Valores de t a la derecha de los
cuales se encuentra el (100 x
)% área de la curva.
• Localizamos la columna del
valor de  y fila del valor de .
La intersección de la fila y la
columna nos dará el valor de t.
Probabilidad “t” en Excel
• =DISTR.T(x,,colas)
– Devuelve el área a la derecha de x ()
– x= valor de t (solo positivo)
– = grados de libertad
– Colas = 1 o 2 colas
• colas= 1, P( X>t )
• colas = 2, P(|X| > t); P(X > t o X < -t).
Probabilidad “t” Inversa en Excel
• =DISTR.T.INV(,)
– Devuelve el valor de t de dos colas, después del cual se
encuentra el  x 100% del área de la curva.
– P(|X| > t) = P(X < -t o X > t).
– Para una cola, remplazar  por 2 .
Ejercicio en tabla y Excel
a) Calcular la probabilidad de obtener un valor mayor
que 2,26 en una distribución t con 9 gdl

b) Calcular la probabilidad de obtener un valor mayor


que 2,26 o menor que -2,26 en una distribución t
con 9 gdl

c) Calcular el valor de t después del cual se encuentre


el 5% del área dela curva con 9 gdl

d) Calcular el valor de t para a= 0,05 con 9 gdl y dos


colas
Ji-cuadrado
• Distribución Ji-cuadrado es una función de densidad
de probabilidad que representa la distribución
muestreal de la varianza.

• Definimos el estadístico Ji-cuadrado (2) como:

2
(n - 1) s
 =2

 2
Caracteristicas Ji-cuadrado
• Asimétrica y asintótica al eje x por la derecha;
• Su dominio va de 0 a +
• Area bajo la curva desde 0 a + =1
• Tiene parámetro  = n-1 (g.d.l.)
• Al aumentar n se aproxima a la normal
• Representa distribución muestreal de varianza.
• Entre las aplicaciones:
– Determinación intervalos confianza para varianzas
– Pruebas de hipótesis para una varianza
– Tablas de contingencia
– El ajuste de datos a una distribución dada conocida
– Las pruebas de independencia.
Tabla Distribución 2
• Valores 2 para varios ,
• Area a su derecha = .
• 1ª columna = 
• 1ª fila: áreas en la cola a la
derecha de 2
• Cuerpo tabla son los valores
de 2
Probabilidad 2 Excel
• =DISTR.CHI(x;)
• Devuelve la probabilidad de una variable
aleatoria continua siguiendo una distribución
chi cuadrado de una sola cola con  g.d.l.
• P(X>2)
Probabilidad 2 Inversa Excel
• =PRUEBA.CHI.INV(P,)
• Devuelve el valor de 2 para una probabilidad
dada, de una distribución Ji-cuadrado de una
sola cola con  g.d.l.
Ejercicios
• Ejercicio06 - DistribucionJi-cuadrado.xlsx

a) Calcular la probabilidad de obtener un valor


mayor de 23.7 en una distribución 2 con  =
14 g.d.l.
b) Calcular el valor de 2 despues del cual se
encuentre el 5% del área en una distribución
Ji-cuadrado con 4 g.d.l.
Distribución "F” de Fisher
• Tambien llamada "F” de Fisher - Schnedecor
• Representa la distribución muestreal de la razón de
dos varianzas. Es decir que se obtiene de la razón de
dos distribuciones Ji-cuadrado.
• Definimos el estadístico F como:
2
s
F= 2 1

s2
• El cual es el valor de una variable aleatoria que tiene
distribución F con parámetros 1=n1-1 y 2=n2-1.
Propiedades de Distribución F
• Asimétrica, y asintótica al eje x por el lado derecho
• Su dominio va de 0 a +
• Area bajo curva desde 0 a + =1
• Tiene parámetros 1=n1-1 y 2=n2-1.
• Entre sus aplicaciones:
– Pruebas de hipótesis entre 2 varianzas
– Análisis de varianza
– Análisis de covarianza.
Tabla de Distribución F
• Tablas independientes de
valores de F para =0.01 y
=0.05 para varias
combinaciones de 1 y 2.
• Se escoge la tabla para la
probabilidad deseada y se
escoge 1 en la fila superior
y 2 en la 1ª columna. La
intersección nos da el valor
de F deseado.
Probabilidad F Excel
• =DISTR.F(x,1, 2)
• Devuelve el área a la derecha de un valor en
una distribución F con 1 y 2 g.d.l.
• P( F>x )
Probabilidad F Inversa Excel
• =DISTR.F.INV(, 1, 2)
• Devuelve el valor crítico de F() para una
distribución F con 1, 2 g.d.l.
Ejercicios
• Ejercicio07 - DistribucionF.xlsx

a) Determine la probabilidad de tener un valor


de F mayor que 9.28 en una distribución F
con 1=3 y 2=3 g.d.l.

b) Halle la el valor crítico de F(0.05) para 1=3 y


2=15 g.d.l.
“La inteligencia es una palabra que todos
tenemos, descúbrela.”

GRACIAS POR ESCUCHARME

56

También podría gustarte