Clase02 - Distribuciones de Probabilidad

Descargar como ppt, pdf o txt
Descargar como ppt, pdf o txt
Está en la página 1de 64

Distribuciones de Probabilidad

Distribución de Probabilidad
 Una distribución o densidad de probabilidad de una
variable aleatoria x es la función de distribución de la
probabilidad de dicha variable
 Área de curva entre 2 puntos representa la probabilidad de que
ocurra un suceso entre esos dos puntos.
 Distribuciones probabilidad pueden ser discretas o
continuas, de acuerdo al tipo de.
 Hay infinidad distribuciones probabilidad, (1
c/población), pero hay ciertas distribuciones “modelo”:
 Normal
 Binomial
 Ji-cuadrado
 "t" de Student,
 F de Fisher

-1 0 +1
Distribución binominal
 Describe la probabilidad de una variable dicotómica
independiente.

Distribución Binominal de un hombre en un grupo de 10


Probabilidad

0.3
0.25
0.2
0.15
0.1
0.05
0
0 1 2 3 4 5 6 7 8 9 10
Número de hombres en un grupo de 10
Utilidad
 Se utiliza en situaciones cuya solución tiene dos
posibles resultados.
 Al nacer un/a bebé puede ser varón o hembra.
 En el deporte un equipo puede ganar o perder.
 Un tratamiento médico puede ser efectivo o inefectivo.
 Vivo / muerto; enfermo / sano; verdadero / falso
 Prueba múltiple 4 alternativas: correcta o incorrecta.
 Algo puede considerarse como Éxito o Fracaso
 “Experimentos de Bernoulli”
 Usos:
 Estimación de proporciones
 Pruebas de hipótesis de proporciones
Propiedades de un
experimento de Bernoulli

1. En cada prueba del experimento sólo hay dos posibles resultados:


Éxitos o Fracasos.
2. El resultado obtenido en cada prueba es independiente de los
resultados obtenidos en pruebas anteriores.
3. La probabilidad de un suceso (p) es constante y no varía de una
prueba a otra.
4. La probabilidad del complemento (1- p) es q .
 Si repetimos el experimento n veces podemos obtener datos para
armar una distribución binomial.
La Distribución Binomial

 Ejemplo distribución probabilidad discreta.


 Formada por serie experimentos Bernoulli.
 Resultados de cada experimento son mutuamente
excluyentes.
 Para construirla necesitamos:
1. La cantidad de pruebas n
2. La probabilidad de éxitos p
3. Utilizar la función matemática P(x=k).
La función P(x=k)
Función de la distribución de Bernoulli:

 k = número de aciertos.
 n = número de experimentos.
 p = probabilidad de éxito, como por ejemplo, que salga "cara"
al lanzar la moneda.
 1-p = “q”
 Excel =DISTR.BINOM(k , n, p, acumulado)
 Acumulado = falso : solo para x=k
 Acumulado = Verdadero : para x≤k
Ejemplo 1
 ¿Probabilidad de obtener 6 caras al lanzar una
moneda 10 veces?
 El número de aciertos k es 6. Esto es x=6
 El número de experimentos n son 10
 La probabilidad de éxito p = 0.50
 La fórmula quedaría:

P (k = 6) = 0.205
 Es decir, que la probabilidad de obtener 6 caras
al lanzar 10 veces una moneda es de 20.5% .
Ejemplo 2
 ¿Probabilidad de obtener cuatro veces el número 3
al lanzar un dado ocho veces?
 El número de aciertos k es 4. Esto es x=4
 El número de experimentos n son 8
 Probabilidad de éxito p = 1/6 ( 0.1666)
 La fórmula queda:

 P (k = 4) = 0.026
 Es decir, probabilidad de obtener cuatro veces el
número 3 al tirar un dado 8 veces es de 2.6%.
Media, Varianza, y Desviación Estandar
en Distribución Binomial

  n p
2
  n pq
  n pq
Ejemplo
 Al adivinar al azar un examen de 100 preguntas multiples, cada una
con 4 posibles respuestas:

  100  1 4  25
  100  1 4  3 4  18.8
2

  100  1 4  3 4  4.3
Distribución Normal
 Descubierta en 1733 por el francés Moiure,
descrita también por Laplace y Gauss (sinónimo
de la forma gráfica de esta distribución).
 Importancia práctica de esta distribución
teórica:
 Muchos fenómenos distribuidos suficientemente
Normal que distribución es la base de gran parte de
la teoría estadística usada en la práctica.
 Distribución de promedios.
 Distribución de errores.
Características distr. Normal
 Área bajo la curva entre 2 puntos representa probabilidad que
ocurra un hecho entre esos dos puntos
 Su dominio va de menos infinito a más infinito;
 Es simétrica con respecto a su media;
 Tiene dos colas y es asintótica al eje x por ambos lados;
 El valor del área debajo de toda la curva es igual a 1;
 El centro de la curva está representado por la media poblacional
().
 Para cualquier curva normal, el área de - a + es igual a 0.6827;
de -2 a +2 de 0,9545 y de -3 a +3 de 0,9973;
 Distribución muestreal de varios estadísticos, como x es normal e
independiente de distribución de la población.
Distr. Normal Tipificada (estandarizada)
 Distribución especial que representa a todas las variables aleatorias
normales y que es la distribución de otra variable normal llamada Z:

x -
Z=

 =NORMALIZACION(x;media;desv_estándar)
 Z se la conoce como variable aleatoria estandarizada.
 Esta función se caracteriza por tener media igual a cero y desviación
tipificada igual a uno : N(0,1)
 Representa a todas las distribuciones Normales. Igual densidad de
probabilidad, si medimos desviaciones de media en base a .
 Valores obtenidos de tabla Normal válidos para todas las distribuciones
Normal de media =  y varianza =2.
Densidad de Probabilidad
 N (0,1) y N(,2)
Probabilidad Acumulada

 N (0,1) y N(,2)
Tabla Distribución Z
=DISTR.NORM.ESTAND(Z)
Uso de Tabla Distribución Z
 Para determinar la probabilidad de ocurrencia de un
suceso entre 2 puntos debemos determinar el área bajo la
curva entre dichos puntos.
 Depende tipo de tabla. Usaremos tabla de -a X, ya que
da la probabilidad acumulada al igual que Excel.
 Existen otros tipos de tabla
 0 a X, X a , etc.
 Debemos razonar siempre como determinar el área.
 En nuestra tabla, para determinar P(-a X) o P(Z ≤ X):
1. Buscamos en la columna izquierda de la tabla el valor del entero y
primer decimal
2. Buscamos en la fila superior el valor del segundo decimal,
3. Interceptamos ambos valores obteniendo el valor de P.
4. Interpretamos este valor
Probabilidad Normal Excel
=DISTR.NORM.ESTAND(Z)
 Devuelve la función de distribución
normal estándar acumulativa. La
distribución tiene una media de 0 (cero) y
una desviación estándar de uno. Use esta
función en lugar de una tabla estándar de
áreas de curvas normales
Uso Tabla Normal Estándar
(a) Obtenga la probabilidad de que Z obtenga
los siguientes valores:
 P (1.17)
 Buscamos en la columna izquierda de
la tabla el valor 1.1, y en la primera
fila el valor 0.07, interceptamos ambos
valores obteniendo el valor de 0.8790,
que es el valor que buscábamos:
P( 1.17) = 0.879
Uso Tabla Normal Estándar
(b)  P(0

Z  1.17)
Esto lo podemos escribir de la siguiente forma
también:
P(Z ≤1.17) - P(Z 0)
 El primer término lo conocemos, por que lo
resolvimos en el literal a.
 Para el segundo término sabemos que la
distribución normal es simétrica y que su área
total es igual a 1, por lo tanto el área que hay de
-a 0 (P(Z  0)) es igual a 1/2 = 0.5.
 Por lo que el valor que buscábamos estará dado
por:
P(0≤ Z  1.17) = 0.879 - 0.5 = 0.379
Uso Tabla Normal Estándar
(c)  P(Z 1.17)
 Sabiendo que el área total bajo toda la curva
Normal de - a + es igual a 1, y conociendo
el valor del área de - a 1.17, el valor del
área de 1.17 a +será:
1 - P(Z  1.17) = 1 - 0.879 = 0.121
Uso Tabla Normal Estándar
(d)  P(Z  -1.17)
 Como estamos tratando con una curva
simétrica, este valor será el mismo que el del
literal c:
P(Z  -1.17) = P(Z  1.17) = 0.121
Uso Tabla Normal Estándar
(e)  P(0.42 Z  1.17)
 Al igual que en el literal b, esto lo podemos escribir
como:

P(Z ≤1.17) - P(Z 0.42).


 El primer valor lo conocemos, el segundo lo encontramos
en la tabla de la misma forma:

P( Z  1.17) – P(Z  0.42)= 0.879-0.6628=


0.2162
Uso Tabla Normal Estándar (f)

h) P(|Z|  1.17)
 Determinar el área de - a -1.17 y de 1.17 a +. Como la
curva es simétrica, simplemente multiplicamos el valor de
P(Z  1.17) del literal c por 2:

P(|Z|  1.17) = 2 x P(Z  1.17) = 2 x 0.121 = 0.242


Uso Tabla Normal Estándar
(g)
i) P(|Z|  1.17)
 Área dada por 1 menos valor literal h, ya que el valor total
del área es igual a 1:

P(Z 1.17) = 1- P(Z 1.17) = 1 - 0.242 = 0.758


Tabla Distribución Z Inversa
 Otro caso diferente para el cual podemos utilizar la tabla
es para encontrar el valor de Z después del cual se
encuentra un  x 100 % del área de la curva.
 Esto equivale a decir buscar el valor de Z cuya
probabilidad de ser mayor sea 100 x  %, o en su defecto
que su probabilidad de ser menor sea de (1-)x100 %
Inverso Normal Excel
 =DISTR.NORM.ESTAND.INV(probabilidad)
 Devuelve el inverso de la distribución
normal estándar acumulativa. Calcula el
valor de Z en donde el área de la curva a
su izquierda es igual a la probabilidad
buscada.
 Se calcula con base en iteraciones, y el
grado de precisión puede variar.
Inverso Tabla Normal(0,1)
(a)  Hallar el valor de Z antes del cual se
encuentra el 0.879 del área de la curva
 Buscamos en el cuerpo de la tabla el
valor correspondiente a 0.8790. Vemos
en la columna que corresponde al
valor 1.1, y en la primera fila el valor a
0.07, lo que nos da
Z(1-0.879)=1.17
Inverso Tabla Normal(0,1) (b)
 Hallar el valor de Z después del cual se
encuentra el 5% del área de la curva:
 Esto corresponde a un valor de  = 0.05
 Esto equivale a decir buscar el valor de Z tal que:
P(Z  x) = 0.05
 Buscamos en la tabla el valor de 1 - 0.05 = 0.95
 Este se encontraría en la fila correspondiente a 1.6,
entre los valores de las columnas 4 (0.9495) y 5
(0.9505), interpolamos 4.5, y Z sería igual a 1.645.
Z(0.05) = 1.645
Inverso Tabla Normal(0,1)
(c)  Hallar el valor de Z tal que el área sobre el
mas el área bajo -Z sea igual a 0.05:
 Esto equivale a decir buscar el valor de Z tal
que:
P(|Z|  x) = 0.05
 Como es una curva simétrica:  =
0.05/2=0.025
 Buscamos en la tabla el valor de 1 - 0.025 =
0.95
Z(0.025) = 1.96
Inverso Tabla Normal(0,1)

 (d) Hallar el valor de Z después del cual se


encuentra el 1% del área de la curva:
 Esto corresponde a un valor de  = 0.01
 En Excel =DISTR.NORM.ESTAND.INV(0.99)
Z(0.01) = 2.326

 (e) Hallar el valor de Z tal que el área sobre el mas


el área bajo -Z sea igual a 0.01:
 Como es una curva simétrica:  = 0.01/2=0.005
 En Excel =DISTR.NORM.ESTAND.INV(0.995)
Z(0.005) = 2.576
Buscar en la tabla para comprobar
Distribución

Normal (, )
Esto Ok! para curva N (0,1) pero y si queremos
usarlo en población natural con 0 y 1?
 Nohay problema! Tipificamos valor de x en
nuestra distribución Normal con fórmula:
x -
Z=

Y procedemos a buscar la probabilidad para este
valor determinado.
Z no es más que el número de desviaciones
estándares a la que se encuentra x de .
Tipificar en Excel

 = NORMALIZACION(x,)
 Valor normalizado de distribución
caracterizada por los argumentos media y
desv_estándar : Z =x-
 =DISTR.NORM(x, Verdadero)
 Calcula probabilidad de que un valor se
encuentre bajo x en una distribución N():
P(Z ≤ x)
 DISTR.NORM.INV(P,)
 Devuelve el valor x abajo del cual se encuentra
el Px100% del área de la curva para una
distribución N().
Ejercicio
a) Encontrar la probabilidad que al muestrear una
piscina con una población Normal con peso =5g y
2=4 encontremos un valor > 7.78g.
 Como 2=4, entonces  = 2.
 Calculamos el valor de Z:
7.78 - 5
Z= = 1.39
2
 Y luego calculamos la probabilidad de que Z sea mayor a
este valor en la tabla:
P(Z  1.39) = 1-0.9177=0.0823
 En Excel lo podemos hacer directo o por pasos
b) En la misma piscina calcular entre que valores de
peso se encuentra el 95% de la población
Distribución Derivada

 Al muestrear repetidamente una población,


obtenemos distribución de sus x.
 Distribución Derivada es Normal,
independiente de distribución de la
Población.
  de población de x de tamaño n es igual a
la  de población original, y varianza es 1/n
de varianza poblacional :
x =  2x = 2/n Distribucion de Medias
14%

12%

10%

Teorema Central del Límite


PROBABILITY
8%

6%

4%

2%

0%
4.0 6.0 8.0 10.0 12.0 14.0 16.0
Values

Dist. Deriv Dist. Pobl.


Distribucion de Medias
14%

12%

10%
PROBABILITY

8%

6%

4%

2%

0%
4.0 6.0 8.0 10.0 12.0 14.0 16.0
Values

Dist. Deriv Dist. Pobl.


Ejercicio
 Encontrar la probabilidad que al sacar una muestra
de tamaño n=16 de una población con =10 y 2=4
encontrar un promedio ≥ 11.
 x es una muestra de población normal derivada con:
x =  = 10 ; 2x = 2/n = 4/16 = 1/4; x = ½
 Buscamos distancia de nuestro promedio a la media:
x - x 11- 10
Z= = =2
x 1/ 2
 Buscando en la tabla: P(Z  2) = 0.228
 Por lo que podemos decir que la probabilidad de
sacar un muestreo de n = 16 y x  11 es de 2.28%,
lo cual se considera “poco usual”.
Distribución “t” de Student

 Desarrollada con base en


distribuciones de frecuencia empíricas
por William Gosset, (a) “Student”.
 “The probable error of a mean” Biometrika 1908

 Cervecero - estadístico con


dificultadas al usar distribución
Normal en muestras pequeñas.
 Sin embargo fue Fisher el que
encontró mas aplicaciones para esta
Distribución “t” de Student

 Distribución muestreal del promedio se


ajusta muy bien a la distribución Normal
cuando se conoce . Si n es grande, esto
no presenta ningún problema, aun cuando
 sea desconocida, por lo que en este
caso es razonable sustituirla por s.
 Sin embargo, en el caso de usar valores de
n < 30, o sea en el caso de pequeñas
muestras, esto no funciona tan bien.
Distribución “t” de Student

 Definiendo el estadístico t:
x -
t=
s/ n
 Se puede probar que siendo x el
promedio de una muestra tomada de una
población normal con media  y varianza
2, el estadístico t es el valor de una
variable aleatoria con distribución "t" de
Student y parámetro  (grados de
libertad) = n-1.
Características Distribución “t”
 Tiene media igual 0, es asintótica al eje x y su
dominio va de - a +;
 El área bajo la curva desde - a +es igual a 1
  0, 2 depende parámetro  (grados libertad)
 Varianza > 1, pero se aproxima a 1 cuando n
 Al aumentar n, la distribución “t se aproxima a la
Normal; n > 30 ó más, excelente aproximación
 Entre las aplicaciones:
 Estimación de intervalos de confianza para medias a partir
de muestras pequeñas
 Pruebas de hipótesis basadas en muestras < 30
Tabla de Distribución “t”

 Valores de t a la derecha de
los cuales se encuentra el
(100 x )% área de la curva.
 Localizamos la columna del
valor de  y fila del valor de
. La intersección de la fila
y la columna nos dará el
valor de t.
Probabilidad “t” en Excel

 =DISTR.T(x,,colas)
 Devuelve el área a la derecha de x ()
 x= valor de t (solo positivo)
 = grados de libertad
 Colas = 1 o 2 colas
 colas= 1, P( X>t )
 colas = 2, P(|X| > t); P(X > t o X < -t).
Probabilidad “t” Inversa
en Excel
 =DISTR.T.INV(,)
 Devuelve el valor de t de dos colas,
después del cual se encuentra el  x
100% del área de la curva.
 P(|X| > t) = P(X < -t o X > t).
 Para una cola, remplazar  por 2.
Ejercicio en tabla y Excel
a) Calcular la probabilidad de obtener un valor mayor
que 2,26 en una distribución t con 9 gdl

b) Calcular la probabilidad de obtener un valor mayor


que 2,26 o menor que -2,26 en una distribución t
con 9 gdl

c) Calcular el valor de t después del cual se


encuentre el 5% del área dela curva con 9 gdl

d) Calcular el valor de t para a= 0,05 con 9 gdl y dos


colas
Ji-cuadrado
 DistribuciónJi-cuadrado es una
función de densidad de probabilidad
que representa la distribución
muestreal de la varianza.

 Definimos el estadístico Ji-cuadrado


(2) como:
2 (n - 1) s 2
 = 2

Caracteristicas Ji-cuadrado
 Asimétrica y asintótica al eje x por la derecha;
 Su dominio va de 0 a +
 Area bajo la curva desde 0 a + =1
 Tiene parámetro  = n-1 (g.d.l.)
 Al aumentar n se aproxima a la normal
 Representa distribución muestreal de varianza.
 Entre las aplicaciones:
 Determinación intervalos confianza para varianzas
 Pruebas de hipótesis para una varianza
 Tablas de contingencia
 El ajuste de datos a una distribución dada conocida
 Las pruebas de independencia.
Tabla Distribución 2

 Valores 2 para varios ,


 Area a su derecha = .
 1ª columna = 
 1ª fila: áreas en la cola a
la derecha de 2
 Cuerpo tabla son los
valores de 2
Probabilidad 2 Excel

 =DISTR.CHI(x;)
 Devuelve la probabilidad de una variable aleatoria
continua siguiendo una distribución chi cuadrado de una
sola cola con  g.d.l.
 P(X>2)
Probabilidad 2 Inversa
Excel
 =PRUEBA.CHI.INV(P,)
 Devuelve el valor de 2 para una probabilidad dada, de
una distribución Ji-cuadrado de una sola cola con 
g.d.l.
Ejercicios

a) Calcular la probabilidad de obtener un valor mayor de


23.7 en una distribución 2 con  = 14 g.d.l.
b) Calcular el valor de 2 despues del cual se encuentre
el 5% del área en una distribución Ji-cuadrado con 4
g.d.l.
Distribución "F” de Fisher
 Tambien llamada "F” de Fisher - Schnedecor
 Representa la distribución muestral de la razón de
dos varianzas. Es decir que se obtiene de la razón
de dos distribuciones Ji-cuadrado.
 Definimos el estadístico F como:

2
s
F= 2 1

s2
 El cual es el valor de una variable aleatoria que
tiene distribución F con parámetros 1=n1-1 y 2=n2-
1.
Propiedades de Distribución F

 Asimétrica, y asintótica al eje x por el


lado derecho
 Su dominio va de 0 a +
 Area bajo curva desde 0 a + =1
 Tiene parámetros  =n -1 y  =n -1.
1 1 2 2
 Entre sus aplicaciones:
 Pruebas de hipótesis entre 2 varianzas
 Análisis de varianza
 Análisis de covarianza.
Tabla de Distribución F

 Tablas independientes de
valores de F para =0.01 y
=0.05 para varias
combinaciones de 1 y 2.
 Se escoge la tabla para la
probabilidad deseada y se
escoge1 en la fila
superior y 2 en la 1ª
columna. La intersección
nos da el valor de F
deseado.
Probabilidad F Excel

 =DISTR.F(x,1, 2)
 Devuelve el área a la derecha de un valor en una
distribución F con 1 y 2 g.d.l.
 P( F>x )
Probabilidad F Inversa Excel

 =DISTR.F.INV(1, 2)
 Devuelve el valor crítico de F() para una distribución F
con 1, 2 g.d.l.
Ejercicios

a) Determine la probabilidad de tener un valor de F


mayor que 9.28 en una distribución F con 1=3 y 2=3
g.d.l.

b) Halle la el valor crítico de F(0.05) para 1=3 y 2=15


g.d.l.

También podría gustarte