Resumen Anual - PyE

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 33

1

Resumen Anual – Probabilidad y Estadística


Unidad 1: Estadística descriptiva
La estadística es una ciencia matemática aplicada que diseña un
modelo no determinístico, sino estadístico, es decir, de situaciones
aleatorias. Hay al menos un componente aleatorio. La población a
estudiar son los individuos u objetos en estudio por alguna razón o
criterio. Generalmente se toma una muestra de la población. Cuando
de una muestra se intenta estudiar una población completa, hablamos
de estadística inferencial, donde existe un porcentaje de error.
La estadística descriptiva son los métodos para organizar, exponer,
resumir los datos recolectados. No solo es importante la recolección de
datos, sino también la evaluación del contexto.

Es importante la ubicación en las variables para evaluar correctamente cómo presentar los datos para su
estudio.
Un experimento doble ciego implica aplicar una experimentación a un grupo de dos, pero no hacerle saber a
ninguno de los dos grupos si se les está haciendo la prueba o no. La persona que hace la experimentación
tampoco está enterada. Ejemplo: prueba voluntaria para la vacuna contra el COVID-19.
Las variables cuantitativas se representan gráficamente en gráficos de barra, torta, en función de lo que se
quiera hacer o mostrar, el mensaje que se quiera dejar.
Medidas de tendencia central: cuando el tiempo no interesa, los datos se ordenan de menor a mayor. Datos no
agrupados.

Usa toda la información que proveen los datos. Es de manejo algebraico simple. Es muy
Media o promedio sensible a la presencia de datos extremos.
𝑥1+𝑥2+…+𝑥𝑛
𝑥= 𝑛

Número que está en el medio cuando los registros están ordenados de menor a mayor.
Representa el centro de la distribución. Usa muy poca información de los datos.
Mediana ~ 𝑥𝑘+𝑥𝑘+1
𝑥 = {𝑥𝑘 + 1 𝑠𝑖 𝑛 = 2𝑘 (𝑝𝑎𝑟) 2
𝑠𝑖 𝑛 = 2𝑘 + 1 (𝑖𝑚𝑝𝑎𝑟)
𝑛+1
Posición de la mediana: 2

Cuando cada registro tiene un peso diferente que se debe tener en cuenta (𝑤≥0).
Media ponderada ~ 𝑤1𝑥1+𝑤2𝑥2+…+𝑤𝑛𝑥𝑛
𝑥𝑝𝑜𝑛𝑑𝑒𝑟𝑎𝑑𝑎 = 𝑤1+𝑤2+…+𝑤𝑛
2

Cuando tengo datos atípicos que modifican el promedio y no es real, se recortan los
Media recortada
datos extremos con algún criterio simétricamente.

Moda Número, valor o cualidad que más se repite.

Medidas de variabilidad o dispersión: indican cuán disperso es el conjunto de datos, cuán cercanos se
encuentran entre ellos.
𝑥𝑚á𝑥 − 𝑥𝑚í𝑛
Rango muestral

Variación medida desde la


𝑑1 = 𝑥1 − 𝑥 ; 𝑑2 = 𝑥2 − 𝑥 ; 𝑑𝑛 = 𝑥𝑛 − 𝑥 Varianza dispersión:
muestral 𝑛 2

Deviaciones con respecto a {


Máximo desvío: |||𝑥𝑖 − 𝑥||| }
𝑛

𝑖=1
2 1
𝑠 = 𝑛−1 ∑ 𝑥𝑖 − 𝑥
𝑖=1
( )
la media
𝑛 La mayoría de los datos se
Punto de equilibrio: ∑ (𝑥𝑖 − 𝑥) = 0 Desvío
encuentran en este rango:
𝑖=1 estándar
2
𝑠= 𝑠
Los percentiles son otro modo de resumir una distribución muestral o poblacional. El percentil 𝑝% de un
conjunto de datos es la observación que deja a lo sumo 𝑝% de las observaciones a la izquierda de él y a lo sumo
(1 − 𝑝)% a la derecha. Por ejemplo: el percentil 𝑝30 deja al 30% de los datos a la izquierda de ese valor. El
~
percentil 𝑝50 = 𝑥.

Además, los datos se pueden dividir en cuartiles:


− 𝑞1 = 𝑝25 (cuartil inferior)
~
− 𝑞2 = 𝑝50 = 𝑥
− 𝑞3 = 𝑝75 (cuartil superior)
− 𝑞4 = 𝑝100 = totalidad de los datos

El recorrido intercuartílico es 𝑞3 − 𝑞1 = 𝑝75 − 𝑝25 = 𝑓𝑠


𝑛 3
Coeficiente de
asimetría
γ=
𝑛
3 (
∑ [ 𝑥𝑖 − 𝑥 ]
(𝑛−1)(𝑛−2)𝑠 𝑖=1
)
3

Indica el coeficiente de aplastamiento que es la concentración de la distribucióna través del


modo.
Curtosis
𝑛 3 ⎱

( )
2
𝑛(𝑛+1) ⎡ ⎤ (𝑛−1)
𝑘= ∑ ⎢ 𝑥𝑖 − 𝑥 ⎥ − 3
⎱ (𝑛−1)(𝑛−2)(𝑛−3)𝑠 𝑖=1⎣
4
⎦⎰
(𝑛−2)(𝑛−3)

Entre los gráficos para la presentación de los datos podemos analizar:


Box-plot: es útil para comparar distribuciones de varios conjuntos de observaciones. Está basado en medidas
robustas de posición y dispersión.

Histogramas: pretende mostrar la forma de la distribución de los datos. Datos agrupados en tablas de
frecuencias.
Se debe construir una tabla de frecuencias. Las clases o intervalos de clase de una tabla de frecuencias deben
ser mutuamente excluyentes y exhaustivas, es decir, cada dato debe caer en una y sólo una clase y todos los
datos deben tener una clase a la cual pertenecen. Para construir una tabla de frecuencias:
1. Se divide el rango total de los datos en clases o intervalos (no necesariamente deben tener la misma
longitud).
2. Se cuenta el número de observaciones que cae en cada clase y se determina la frecuencia en cada clase.
3. Se calculan las frecuencias relativas, acumuladas y acumuladas relativas para cada intervalo. 𝑓𝑖 =
número de casos que cae en el intervalo 𝑖-ésimo. La frecuencia acumulada es 𝑓𝑎𝑖 = 𝑓1 + 𝑓2 + … + 𝑓𝑖 =
suma de las frecuencias desde la primera categoría hasta la categoría 𝑖-ésima.
4

Se pueden tomar las medidas numéricas descriptivas de un conjunto de datos agrupados en clases. Si el
*
conjutno de 𝑛 datos se ha agrupado en un número de 𝑘 clases, sea 𝑥𝑖 la marca de la 𝑖-ésima clase y 𝑓𝑖 la
𝑘
frecuencia de la 𝑖-ésima clase, de modo que 𝑛 = ∑ 𝑓𝑖. El valor aproximado de la media muestral de los datos
𝑖=1
𝑘
1 *
agrupados es 𝑥𝑠 = 𝑛
∑ 𝑓𝑖𝑥𝑖 .
𝑖=1

Para los datos agrupados es necesario determinar la clase que contiene el valor de la mediana para después
determinar el valor de la mediana dentro de la clase mediante interpolación. La clase que contiene la
mediana es la primera cuya frecuencia acumulada iguala o excede la mitad del total de observaciones. Para

( )
𝑚−1
~ 1 𝑛
calcular el valor exacto de la mediana una vez que se la ubicó en la clase: 𝑥𝑠 = 𝐿𝑖(𝑚) + 𝑓 . 2 − ∑ 𝑓𝑖 . 𝑙𝑚.
𝑚 𝑖=1
Donde 𝐿𝑖(𝑚)es el límite inferior de la clase que contiene la mediana, 𝑛 es el número total de observaciones en la
𝑚−1
distribución de frecuencias, ∑ 𝑓𝑖 es la sumatoria de las frecuencias de todas las clases por debajo de la clase
𝑖=1
que contiene a la mediana, 𝑓𝑚 es la frecuencia de la clase de la mediana y 𝑙𝑚es el tamaño del intervalo de la clase
de la mediana.
Para determinar los percentiles y cuartiles en los datos agrupados, en primer lugar se determina la clase que
contiene el punto de interés, de acuerdo con las frecuencias acumuladas y luego se lleva a cabo una
interpolación como se hizo para el caso de la mediana. Por ejemplo, el primer cuartil se calcula como:

( )
𝑞−1
1 𝑛
𝑄1 = 𝐿𝑖(𝑞) + 𝑓𝑞
. 4
− ∑ 𝑓𝑖 . 𝑙𝑞
𝑖=1
5

Donde 𝐿𝑖(𝑞) es el límite inferior de la clase que contiene al primer cuantil, 𝑛 es el número total de observaciones
𝑞−1
en la distribución de frecuencias, ∑ 𝑓𝑖 es la suma de las frecuencias de todas las clases por debajo de la clase
𝑖=1
del primer cuantil, 𝑓𝑞 es la frecuencia de la clase del cuantil y 𝑙𝑞 es el tamaño del intervalo de dicha clase.

La fórmula para el cálculo de la varianza en los datos agrupados es:


2
⎡𝑘
( ) ⎤
𝑘 2 2 𝑘
2
𝑠𝑔 =
1
𝑛−1 ( *
∑ 𝑓𝑖 𝑥𝑖 − 𝑥𝑔
𝑖=1
) =
1
𝑛−1 ()
⎢ ∑ 𝑓 𝑥*
⎢𝑖=1 𝑖 𝑖

1
𝑛
𝑖=1
*
∑ 𝑓𝑖𝑥𝑖 ⎥

⎣ ⎦

En clase más alta o pico se encuentra la moda:


6

Unidad 2: Introducción a la probabilidad


Un experimento es cualquier acción o proceso que genera observaciones. En base a esto, un experimento
aleatorio posee las siguientes particularidades:
− Repetibilidad: condiciones semejantes a las de la primera vez.
− Espacio Muestral: se define como todos los posibles resultados, por ejemplo, indicando un rango.
− Regularidad/Patrón: infiere que los resultados sean semejantes entre todas las posibilidades, es decir,
todas las opciones deben ser equiprobables.
El modelo estocástico es la matemática que va a buscar ese patrón de los experimentos aleatorios y la
probabilidad le dará peso a la chance relativa de cada elemento de ese espacio muestral.
El espacio muestral (E: conjunto de todos los resultados posibles) puede ser discreto o continuo. Está formado
de eventos (que detallan los resultados) los cuales determinarán la calificación del espacio:
− Discreto (número infinito o finito de elementos). Por ejemplo, un espacio discreto finito es las dos únicas
posibilidades de resultado al tirar una moneda: E = {cara; ceca}. En cambio, si el experimento se trata de
tirar la moneda hasta que salga ceca se trata de un espacio discreto infinito: E = {ceca; cara-ceca;
cara-cara-ceca; …}.
7

− Continuo. Por ejemplo, horas de uso de un foco de luz (entre dos números reales hay infinito números);
la altura real de una persona; se toma un cubito de agua y se registra el tiempo que pasa hasta que se
derrita completamente bajo condiciones prefijadas de experimentación; etc.
A su vez, se pueden categorizar como eventos compuestos o simples. Por ejemplo, se arroja un dado y se
observa qué número aparece en la cara superior, E = {1; 2; 3; 4; 5; 6}. Que salga el número 4 se denomina evento
simple, lo cual puede definirse por extensión o enumeración, A = {4}, o por comprensión, A: sale el número 4. En
cambio, que salga un número par se trata de un evento compuesto, B = {2; 4; 6}, B: sale un número par.
Operaciones con eventos – Teoría de Conjuntos
Diagrama de Venn (la probabilidad del evento no se asocia al tamaño del conjunto en el gráfico).

A = {4}
B = {2; 4; 6}
C = {3; 4; 5; 6}
D = {1; 2; 3}
F = {1; 2; 3; 4; 5; 6}

− Unión (todo lo que esté incluido en al menos uno de los eventos)


𝐴∪𝐷 = {1; 2; 3; 4}
− Intersección (todo lo que tengan en común)
𝐵∩𝐶 = {4; 6}
− Complementación (todo lo que no esté en el evento)
𝐶 '
𝐴 = 𝐴 = 𝐴 = {1; 2; 3; 5; 6}
− Eventos disjuntos o mutuamente excluyentes
𝐴∩𝐷 = { } = ∅
{𝐴∩ 𝐴 = ∅ 𝐴 ∪𝐴 Los eventos complementarios son disjuntos, cuya unión da todo el espacio muestral.

𝐶 '
Evento en el espacio muestral (Sucede A) Complemento de A (𝐴 = 𝐴 = 𝐴 = no sucede A)

Intersección de dos eventos (𝐴∩𝐵) Unión de dos eventos (𝐴∪𝐵)

A y B ocurren simultáneamente, suceden ambos Sucede por lo menos uno de los dos eventos, es
eventos, tanto A como B. decir, sucede A o B.
8

Uno de los dos eventos sucede


Solo sucede A (𝐴∩𝐵) Solo sucede B (𝐴∩𝐵)
(𝐴∩𝐵)∪(𝐴∩𝐵)

Leyes de Morgan

1° Complemento de la Unión 2° Complemento de la Intersección

El complemento de la unión es la intersección de los El complemento de la intersección es la unión de los


complementos, ninguno de los eventos sucede. complementos, a lo sumo uno de los dos eventos
sucede.
(𝐴∪𝐵) = 𝐴 ∩ 𝐵
(𝐴∩𝐵) = 𝐴 ∪ 𝐵 = (𝐴∩𝐵) ∪ (𝐴∩𝐵) ∪ 𝐴 ∩ 𝐵

Tres eventos en un espacio muestral

La intersección de A y B (𝐴∩𝐵∩𝐶) ∪ (𝐴∩𝐵∩𝐶) = (𝐴∩𝐵)

Solo un evento sucede (𝐴∩𝐵 ∩ 𝐶) ∪ (𝐴∩𝐵∩𝐶) ∪ (𝐴 ∩ 𝐵∩𝐶)


9

(𝐴∩𝐵 ∩ 𝐶) ∪ (𝐴∩𝐵∩𝐶) ∪ (𝐴 ∩ 𝐵∩𝐶) ∪ (𝐴 ∩ 𝐵 ∩ 𝐶)

A lo sumo un evento sucede

Desarrollo axiomático de la probabilidad

Siendo E un espacio muestral y A un evento o suceso en E (𝐴⊂𝐸)

Axioma 1 Axioma 2 Axioma 3

Si A y B son dos eventos excluyentes (no existen


valores en común) del espacio muestral, la
𝑃(𝐴)≥0 𝑃(𝐸) = 1 (𝑒𝑣𝑒𝑛𝑡𝑜 𝑐𝑖𝑒𝑟𝑡𝑜) probabilidad de la unión es la suma de la probabilidad
de cada uno.
𝑃(𝐴∪𝐵) = 𝑃(𝐴) + 𝑃(𝐵)
Propiedades:
1- La probabilidad de un evento que pertenece al espacio muestral será: 0≤𝑃(𝐴)≤1.
2- Si A es un evento del espacio muestral, la probabilidad de éste será la unión de A y su complemento:
𝐴∪𝐴 = 𝐸→𝑃(𝐴∪𝐴) = 𝑃(𝐸) → 𝑃(𝐴) + 𝑃(𝐴) = 1.
3- Si el evento no pertenece al espacio muestral, es un evento imposible. 𝑃(∅) = 𝑃({ }) = 0.
∅∩𝐸 = ∅, ∅∪𝐸 = 𝐸→𝐸 = ∅.
4- Si un evento B incluye a todo el evento A, 𝑃(𝐵)≤𝑃(𝐴).
𝑘
( ) ( 𝑘
) ( )
5- Varios eventos mutuamente excluyentes: 𝑃 𝐴1 ∪ 𝐴2∪…∪𝐴𝑛 = 𝑃 ⋃𝑖=1𝐴𝑖 = ∑ 𝑃 𝐴𝑖 . Ahora si estos
𝑖=1
eventos excluyentes son particiones de E y en conjunto abarcan todo el espacio muestral:
( 𝑘
)
𝑃 ⋃𝑖=1𝐴𝑖 = 1.
6- Probabilidad de la unión de dos eventos no excluyentes,
𝐴⊂𝐸, 𝐵⊂𝐸⟹𝑃(𝐴∪𝐵) = 𝑃(𝐴) + 𝑃(𝐵) − 𝑃(𝐴∩𝐵)
7- Probabilidad de la unión de varios eventos no excluyentes,
𝐴⊂𝐸, 𝐵⊂𝐸, 𝐶⊂𝐸 ⟹𝑃(𝐴∪𝐵∪𝐶) = 𝑃(𝐴) + 𝑃(𝐵) + 𝑃(𝐶) − 𝑃(𝐴∩𝐵) − 𝑃(𝐵∩𝐶) − 𝑃(𝐴∩𝐶) − 𝑃(𝐴∩𝐵∩𝐶)

¿Cómo se asigna el valor de la probabilidad de un evento?


− Asignación subjetiva de la probabilidad.
− Asignación como límite de la frecuencia de ocurrencia (Von Mises): se repite un experimento
determinada cantidad de veces y de eso se calcula la probabilidad.
10

− Asignación para el caso de un espacio muestral finito y equiprobable o por Regla de Laplace. Solo
puede ser utilizado para espacios muestrales con eventos equiprobables, 𝐴⊂𝐸, por lo tanto:
𝐶𝑎𝑛𝑡𝑖𝑑𝑎𝑑 𝑑𝑒 𝑐𝑎𝑠𝑜𝑠 𝑓𝑎𝑣𝑜𝑟𝑎𝑏𝑙𝑒𝑠 𝑎 𝐴 𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑒𝑣𝑒𝑛𝑡𝑜𝑠 𝑒𝑞𝑢𝑖𝑝𝑟𝑜𝑏𝑎𝑏𝑙𝑒𝑠 𝑞𝑢𝑒 𝑠𝑒 𝑐𝑜𝑛𝑠𝑖𝑑𝑒𝑟𝑎 𝑑𝑜𝑛𝑑𝑒 𝐴 𝑠𝑢𝑐𝑒𝑑𝑒
𝑃(𝐴) = 𝐶𝑎𝑛𝑡𝑖𝑑𝑎𝑑 𝑑𝑒 𝑐𝑎𝑠𝑜𝑠 𝑝𝑜𝑠𝑖𝑏𝑙𝑒𝑠 𝑒𝑛 𝐸 = 𝑁ú𝑚𝑒𝑟𝑜 𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑒𝑣𝑒𝑛𝑡𝑜𝑠 𝑒𝑞𝑢𝑖𝑝𝑟𝑜𝑏𝑎𝑏𝑙𝑒𝑠 𝑞𝑢𝑒 𝑠𝑒 𝑐𝑜𝑛𝑠𝑖𝑑𝑒𝑟𝑎𝑛 𝑒𝑛 𝐸

Probabilidad Conjunta

Por ejemplo, las bolillas pueden ser rojas (R) o negras (N) e impares (I) o pares (A).

Probabilidad Condicional

𝐴⊂𝐸, 𝐵⊂𝐸 𝑐𝑜𝑛 𝑃(𝐵) > 0 ⟹𝑃 ( )=


𝐴
𝐵
𝑃(𝐴∩𝐵)
𝑃(𝐵)

( ) + 𝑃( ) = 1
Donde 𝑃
𝐴
𝐵
𝐴
𝐵

𝐴⊂𝐸, 𝐵⊂𝐸 𝑐𝑜𝑛 𝑃(𝐴) > 0 ⟹𝑃( ) =


𝐵 𝑃(𝐵∩𝐴)
𝐴 𝑃(𝐴)

Donde 𝑃(𝐵/𝐴) + 𝑃 ( )= 1
𝐵
𝐴

⊂𝐸, 𝐵⊂𝐸 𝑐𝑜𝑛 𝑃(𝐴) > 0, 𝑃(𝐵) > 0⟹𝑃(𝐵∩𝐴) = 𝑃 ( ). 𝑃(𝐵) = 𝑃( ). 𝑃(𝐴)
𝐴
𝐵
𝐵
𝐴

De extracciones, técnicas de conteo y estrategias


Número total de variaciones de m elementos tomados de a n, donde 𝑚≥𝑛.
11

𝑉𝑚,𝑛 = 𝑚(𝑚 − 1)(𝑚 − 2) ... [𝑚 − (𝑛 − 2)][𝑚 − (𝑛 − 1)]⟹


𝑚!
𝑉𝑚,𝑛 = (𝑚−𝑛)!
Variación: Elige grupos distintos, los
permuta y contabiliza el total Número total de variaciones de 𝑚 elementos agrupados de a
𝑛: 𝑉 = 𝐶𝑚,𝑛. 𝑃𝑛
𝑛!
𝑃𝑛 = 𝑉𝑛,𝑛 = 0!
= 𝑛!
Permutaciones: Número de cambios de lugar
de los mismos elementos Permutaciones de 𝑛 elementos (cambiar de posición los
elementos)
𝑉𝑚,𝑛

Números combinatorios: Número de grupos


𝐶𝑚,𝑛 = 𝑃𝑛
=
𝑚!
(𝑚−𝑛)!𝑛!
= ( )
𝑚
𝑛
que difieren en al menos un elemento
𝑚 elementos tomados de a 𝑛 (sin importar la posición)

Si el experimento fuese con reposición, cada vez volvería a comenzar como en la primera extracción, el
resultado de las extracciones subsiguientes a la primera es independiente de cualquier resultado anterior.
Si la población es grande y el número de extracciones no supera al 5% de la especie menos numerosa, si el
experimento se realiza con reposición o sin reposición resulta que las probabilidades de un mismo evento dan
prácticamente lo mismo en ambas operativas.
𝑚!
Variaciones simples de m elementos tomados 𝑉𝑚,𝑛 = (𝑚−𝑛)!
𝑚≤𝑛, 𝑚∈𝑁0, 𝑛∈𝑁0
de a n

Variaciones con repetición de m elementos 𝑛


𝑉𝑚,𝑛 = 𝑚 𝑚∈𝑁0, 𝑛∈𝑁0
tomados de a n

Partición del espacio muestral

La partición de un espacio muestral E


indica un conjunto de eventos Ai con i=1, 2,
…, n que verifican:
− ( )
𝑃 𝐴𝑖 > 0
− 𝐴𝑖 ∩ 𝐴𝑗 = ∅ 𝑠𝑖 𝑖≠𝑗
𝑛
− ⋃𝑖=1𝐴𝑖 = 𝐸

Ninguno de los eventos es imposible, son


disjuntos de a partes y constituyen un
conjunto exhaustivo.

Teorema de Probabilidad Total

Sean {Ai con i=1, 2, …, n} una partición y B


un evento de un espacio muestral E,
entonces:
𝑛
𝑃(𝐵) = ∑ 𝑃(𝐵/𝐴𝑖)𝑃(𝐴𝑖)
𝑖=1

Teorema de Bayes
12

Sean {Ai con i=1, 2, …, n} una partición y B


un evento de un espacio muestral E con
𝑃 ( )
𝐴𝑗
𝐵
=
𝑃(𝐵/𝐴𝑗)𝑃(𝐴𝑗)
𝑃(𝐵)
= 𝑛
𝑃(𝐵/𝐴𝑗)𝑃(𝐴𝑗)

∑ 𝑃(𝐵/𝐴𝑖)𝑃(𝐴𝑖)
𝑗 = 1, 2, …, 𝑛
𝑃(𝐵)≠0. 𝑖=1

Eventos estadísticamente independientes

Sean A y B dos eventos de probabilidad no Los eventos excluyentes (A y B no pueden suceder al mismo
nula dentro de un espacio muestral E, son tiempo) no pueden ser independientes, son dependientes.
estadísticamente independientes si
Si dos eventos A y B son independientes, 𝐴 𝑦 𝐵 también lo son.
𝐴
( )
𝑃 𝐵 = 𝑃(𝐴) 𝑃(𝐴/𝐵) = 𝑃(𝐴)

𝑃 ( )=
𝐴 𝑃(𝐴∩𝐵)

( ) = 𝑃(𝐴); 𝑃(
𝐵
⇒𝑃(𝐴) =
𝑃(𝐵)
𝑃(𝐴∩𝐵) 𝑃
𝐴
𝐵
𝐴
𝐵 ) = 𝑃(𝐴)
( ) = 𝑃(𝐴); 𝑃(𝐴/𝐵) = 𝑃(𝐴)
𝑃(𝐵) 𝐴
⇒𝑃(𝐴∩𝐵) = 𝑃(𝐴). 𝑃(𝐵) ⇒𝑃
𝐵

( ) = 𝑃(𝐵); 𝑃(
𝑃
𝐵
𝐴
𝐵
𝐴 ) = 𝑃(𝐵)
⇒𝑃 ( ) = 𝑃(𝐵); 𝑃(𝐵/𝐴) = 𝑃(𝐵)
𝐵
𝐴
𝑃(𝐴∩𝐵∩𝐶) = 𝑃(𝐴). 𝑃(𝐵). 𝑃(𝐶)
Tres eventos independientes de a pares Si el conjunto no es igual al producto de los marginales, no son
independientes.

Aplicación – Conexiones de elementos de funcionamiento/falla independiente

− Ai: La componente Ai falla con i=1,2, …, n.


− P(Ai): Probabilidad de falla de la componente Ai falla con i=1,2, …, n.
− S: El sistema falla.
− P(S): Prbabilidad de que el sistema falle.
− 1-P(S): Probabilidad de que el sistema funcione.
Dependerá del tipo de conexión y las características de funcionamiento/falla de cada componente.

Conexión en paralelo

En un sistema de conexiones en paralelo, si falla el sistema,


Cada rama es una componente todas las ramas del sistema fallan en forma simultánea:
(
𝑃(𝑆) = 𝑃 𝐴1 ∩ 𝐴2 ∩ 𝐴3∩…∩𝐴𝑛 )
Si cada componente funciona/falla en forma independiente de
las demás:
( ) ( ) ( )
𝑃(𝑆) = 𝑃 𝐴1 . 𝑃 𝐴2 . 𝑃 𝐴3 . … . 𝑃(𝐴𝑛)

Si además todas las componentes tienen la misma probabilidad


de falla:
𝑛 𝑛
𝑃(𝑆) = 𝑝 𝑦 𝑃(𝑆) = 1 − 𝑝 , ( )
𝑠𝑖 𝑃 𝐴𝑖 = 𝑝 ∀𝑖

Conexión en serie

Cada parte es de una componente


13

En un sistema en serie, si funciona el sistema (NO falla), todas las partes del sistema funcionan (NO fallan)
en forma simultánea.

( )
𝑃(𝑆) = 1 − 𝑃(𝑆) = 𝑃 𝐴1 ∩ 𝐴2 ∩ 𝐴3∩…∩𝐴𝑛 ⟹𝑃(𝑆) = 1 − 𝑃 𝐴1 ∩ 𝐴2 ∩ 𝐴3∩…∩𝐴𝑛 ( )
Si cada componente funciona/falla en forma independiente de las demás:

( ) ( ) ( )
𝑃(𝑆) = 1 − ⎡⎢𝑃 𝐴1 . 𝑃 𝐴2 . 𝑃 𝐴3 . … . 𝑃 𝐴𝑛 ⎤⎥
⎣ ⎦ ( )
( ) ( ) ( )
⇒𝑃(𝑆) = 1 − {[(1 − 𝑃 𝐴1 ]. [(1 − 𝑃 𝐴2 ]. [(1 − 𝑃 𝐴3 ]. … . [(1 − 𝑃 𝐴𝑛 ]} ( )
Si además todas las componentes tienen la misma probabilidad de falla:
𝑛 𝑛
𝑃(𝑆) = 1 − (1 − 𝑝) 𝑦 𝑃(𝑆) = (1 − 𝑝) , ( )
𝑠𝑖 𝑃 𝐴𝑖 = 𝑝 ∀𝑖

Unidad 3: Variables aleatorias discretas


Una variable aleatoria discreta (VAD) es una función que a cada evento le asigna un número (ley de
asignación).
𝑃(𝑋 = 𝑥) = 𝑝(𝑥) es una función de probabilidad puntual o distribución de probabilidad, que le asigna una
probabilidad a cada elemento del recorrido.
𝐹𝑥(𝑡) = 𝑃(𝑥≤𝑡) = ∑ 𝑝(𝑥) es la función de distribución o de probabilidad acumulada, que a cada número
real le hace corresponder la probabilidad de que la variable tome un valor menor o igual a él.

𝑃(𝑎 < 𝑥≤𝑏) = 𝐹𝑥 𝑏 ( +) − 𝐹𝑥(𝑎+) 𝑎 < 𝑏


𝑃(𝑎≤𝑥≤𝑏) = 𝐹𝑥 𝑏 ( +) − 𝐹𝑥(𝑎−) 𝑎 < 𝑏
𝑃(𝑎≤𝑥 < 𝑏) = 𝐹𝑥 𝑏( −) − 𝐹𝑥(𝑎−) 𝑎 < 𝑏
𝑃(𝑎 < 𝑥 < 𝑏) = 𝐹𝑥 𝑏 ( −) − 𝐹𝑥(𝑎+) 𝑎 < 𝑏
𝑃(𝑋 = 𝑥) = 𝐹𝑥 𝑥 ( +) − 𝐹𝑥(𝑥−)
Dada una variable aleatoria discreta 𝑋 con recorrido 𝑅𝑥 y conocida su distribución de
Valor esperado probabilidad, se llama valor esperado al número real:
(𝐸(𝑋) = µ𝑥)
𝐸(𝑋) = µ𝑥 = ∑ [𝑥. 𝑝(𝑥)]
𝑥=𝑅𝑥

Dada una variable aleatoria discreta 𝑋 con recorrido 𝑅𝑥 y valor esperado µ𝑥, se llama
varianza de 𝑋 al número no negativo:

Varianza
[ 2
] 2
( 2
) 2
𝑉(𝑋) = 𝐸 (𝑋 − 𝐸(𝑋)) = ∑ ⎡⎢ 𝑥 − µ𝑥 . 𝑝(𝑥)⎤⎥ = ∑ ⎡⎢ 𝑥 − 2𝑥µ𝑥 + µ𝑥 . 𝑝(𝑥)⎤⎥ =
𝑥=𝑅 ⎣ 𝑥
⎦ 𝑥=𝑅 ⎣ ⎦
𝑥
( )
2
2 2
(𝑉(𝑋) = σ𝑥)
[ ]
∑ 𝑥 . 𝑝(𝑥) − 2µ𝑥 ∑ [𝑥. 𝑝(𝑥)] + µ𝑥 ∑ [𝑝(𝑥)] = 𝐸 𝑋 ( 2) − 2𝐸(𝑋)𝐸(𝑋) + [𝐸(𝑋)]2
𝑥=𝑅𝑥 𝑥=𝑅𝑥 𝑥=𝑅𝑥

𝑉(𝑋) = 𝐸 𝑋 ( 2) − [𝐸(𝑋)]2
Desvío estándar = σ𝑥 = 𝑉(𝑋)
14

Propiedades del valor esperado y la varianza

Ecuación Valor esperado Varianza

𝑌=𝑋+𝑏 𝐸(𝑌) = 𝐸(𝑋) + 𝑏 𝑉(𝑌) = 𝑉(𝑋) ⇒ σ𝑦 = σ𝑥


2
𝑌 = 𝑎𝑋 𝐸(𝑌) = 𝑎𝐸(𝑋) 𝑉(𝑌) = 𝑎 𝑉(𝑋) ⇒ σ𝑦 = |𝑎|σ𝑥
2
𝑌 = 𝑎𝑋 + 𝑏 𝐸(𝑌) = 𝑎𝐸(𝑋) + 𝑏 𝑉(𝑌) = 𝑎 𝑉(𝑋) ⇒ σ𝑦 = |𝑎|σ𝑥

Cuando 𝑋 e 𝑌 son independientes:


𝑇=𝑋+𝑌 𝐸(𝑇) = 𝐸(𝑋 + 𝑌) = 𝐸(𝑋) + 𝐸(𝑌)
𝑉(𝑇) = 𝑉(𝑋 + 𝑌) = 𝑉(𝑋) + 𝑉(𝑌)

Cuando 𝑋 e 𝑌 son independientes:


𝐸(𝑇) = 𝐸(𝑎𝑋 + 𝑏𝑌) = 𝐸(𝑎𝑋) + 𝐸(𝑏𝑌) 𝑉(𝑇) = 𝑉(𝑎𝑋 + 𝑏𝑌) = 𝑉(𝑎𝑋) + 𝑉(𝑏𝑌)
𝑇 = 𝑎𝑋 + 𝑏𝑌 2 2
𝐸(𝑇) = 𝑎𝐸(𝑋) + 𝑏𝐸(𝑌) 𝑉(𝑇) = 𝑎 𝑉(𝑋) + 𝑏 𝑉(𝑌)
2 2 2 2
σ𝑡 = 𝑎 σ𝑥 + 𝑏 σ𝑦

Variables aleatorias discretas especiales

Variable aleatoria discreta con distribución Bernoulli


𝑋~𝐵𝑒(𝑝)
𝑋 = 0→ Fracaso
Definición 𝑅𝑥 = {0, 1}
𝑋 = 1→ Éxito

Cuándo se Puede haber solo dos resultados posibles, es un experimento dicotómico.


utiliza
𝑃(𝑋 = 𝑥) = {𝑝 𝑠𝑖 𝑋 = 1 1 − 𝑝 𝑠𝑖 𝑋 = 0 𝑥 1−𝑥
Probabilidad 𝑃(𝑋 = 𝑥) = 𝑝 (1 − 𝑝)
𝐸(𝑋) = 𝑝
Valor esperado
𝑉(𝑋) = 𝑝(1 − 𝑝) σ𝑥 = 𝑝(1 − 𝑝)
Varianza

Variable aleatoria discreta con distribución Binomial


𝑋~𝐵𝑖(𝑛; 𝑝)
𝑋: nº de éxitos que hay en las 𝑛
Definición 𝑅𝑥 = {0, 1, 2, …, 𝑛}
repeticiones.

Se repiten varias veces un experimento Bernoulli. Se define por 𝑛 repeticiones idénticas e


Cuándo se
independientes en donde puede haber un éxito o un fracaso. La probabilidad de éxito es
utiliza
constante. Experimento con reposición.
15

Probabilidad 𝑃(𝑋 = 𝑥) =
𝑛!
(𝑛−𝑥)!𝑥!
𝑥
𝑝 (1 − 𝑝)
𝑛−𝑥
= ( )𝑝 (1 − 𝑝)
𝑛
𝑥
𝑥 𝑛−𝑥

𝐸(𝑋) = 𝑛𝑝
Valor esperado
𝑉(𝑋) = 𝑛𝑝(1 − 𝑝) σ𝑥 = 𝑛𝑝(1 − 𝑝)
Varianza

Variable aleatoria discreta con distribución Binomial Negativa

𝑋: nº de fracasos que preceden al 𝑟-ésimo


Definición 𝑋~𝐵𝑖𝑁𝑒(𝑟; 𝑝)
éxito.

Cuándo se Cuenta la cantidad de fracasos que hubo previos al éxito nº 𝑟. La cantidad de éxitos es fija.
utiliza

Probabilidad 𝑃(𝑋 = 𝑥) = ( 𝑥+𝑟−1


𝑥 )(1 − 𝑝) 𝑝 𝑥 𝑟

𝑟(1−𝑝)
Valor esperado 𝐸(𝑋) = 𝑝
𝑟(1−𝑝)
Varianza 𝑉(𝑋) = 2 σ𝑥 =
𝑟(1−𝑝)
𝑝 2
𝑝

Variable aleatoria discreta con distribución hipergeométrica


𝑋~𝐻(𝑛; 𝑁; 𝑀)
𝑋: nº de éxitos que hay en los 𝑛 de la muestra.
𝑛: Tamaño pequeño de la muestra
𝑁: Tamaño total de la muestra
Definición
𝑀: Éxitos (𝑁 − 𝑀: Fracasos)
{0; 𝑛 − (𝑁 − 𝑀)} ≤𝑥≤𝑚𝑖𝑛⁡{𝑛; 𝑀}

Cuándo se Cuando tomamos una pequeña muestra de una gran población. Tiende a ser una variable
utiliza Binomial mientras más grande sea la población. Extracciones sin reposición.

𝑃(𝑋 = 𝑥) =
( ).( )
𝑀
𝑥
𝑁−𝑀
𝑁−𝑥
Probabilidad
( ) 𝑁
𝑛
𝑀
Valor esperado 𝐸(𝑋) = 𝑛 𝑁

Varianza 𝑉(𝑋) = 𝑛
𝑀
𝑁 ( 𝑁−𝑛
𝑁−1 )(1 − ) 𝑀
𝑁 σ𝑥 = 𝑛
𝑀
𝑁 ( 𝑁−𝑛
𝑁−1 )(1 − )
𝑀
𝑁

Variable aleatoria discreta con distribución geométrica


𝑋~𝐺𝑒𝑜(𝑝)
𝑋: nº de ensayos Bernoulli independientes
Definición Éxitos = 1 e idénticos hasta que se obtiene el 1º éxito
(nº de fracasos).
Fracasos = 𝑥 − 1

Cuando se repite un ensayo Bernoulli hasta obtener el primer éxito. Cuenta la cantidad de
Cuándo se
fracasos que hay antes del primer éxito. Es un caso particular de la binomial negativa
utiliza
(fracasos)/Pascal (ensayos) cuando 𝑟 = 1.
𝑥−1 𝑛 𝑛
Probabilidad 𝑃(𝑋 = 𝑥) = (1 − 𝑝) 𝑝 𝐹𝑥(𝑛) = 𝑃(𝑋≤𝑛) = 1 − (1 − 𝑝) 𝑃(𝑋 > 𝑥) = (1 − 𝑝)
16

1
Valor esperado 𝐸(𝑋) = 𝑝

1−𝑝 1−𝑝
Varianza 𝑉(𝑋) = 2 σ𝑥 = 2
𝑝 𝑝

Variable aleatoria discreta con distribución Pascal


𝑋~𝑃𝑎(𝑝; 𝑟)
𝑋: nº de veces que se repite un ensayo
Definición 𝑅𝑥 = {𝑟, 𝑟 + 1, 𝑟 + 2, …}
hasta que se obtengan 𝑟 éxitos.

Cuándo se Cuando se realiza un ensayo hasta que se obtengan una determinada cantidad de éxitos
utiliza especificada.

Probabilidad 𝑃(𝑋 = 𝑥) = ( )𝑝 (1 − 𝑝)
𝑥−1
𝑟−1
𝑟 𝑥−𝑟

1
Valor esperado 𝐸(𝑋) = 𝑟 𝑝
1−𝑝
Varianza 𝑉(𝑋) = 𝑟 2 σ𝑥 = 𝑟
1−𝑝
𝑝 2
𝑝

Variable aleatoria discreta con distribución Poisson


𝑋~𝑃(λ)
α: Tasa de ocurrencia por unidad de
Definición 𝑋: nº de sucesos en un tiempo o espacio tiempo o por unidad de espacio.
determinado.
λ: α . tiempo / longitud / área / volumen

Cuando estamos contando cuantas veces sucede algo en un determinado tiempo / longitud
/ área / volumen. Es una aproximación de una variable aleatoria Binomial cuando 𝑛 es muy
grande y 𝑝 muy pequeño (λ = 𝑛𝑝→ tiende a infinito).
Cuándo se
utiliza Explicación: se puede particionar el tiempo/espacio total en intervalos en donde la
probabilidad de que suceda es igual en cada intervalo. Si sucede en un intervalo o no, no
afecta a lo que suceda en los demás. No pueden suceder dos cosas en el mismo intervalo;
sucede o no sucede.
−λ 𝑥
𝑒 λ
Probabilidad 𝑃(𝑋 = 𝑥) = 𝑥!

𝐸(𝑋) = µ𝑥 = λ
Valor esperado
2
Varianza 𝑉(𝑋) = σ𝑥 = λ

Unidad 4: Variables aleatorias continuas


La función de densidad de probabilidad o distribución de probabilidad es una función tal que:
𝑏
𝑃(𝑎≤𝑋≤𝑏) = ∫ 𝑓𝑥(𝑥)𝑑𝑥 𝑎 < 𝑏
𝑎

En todos los casos se cumple que:


− 𝑓𝑥(𝑥)≥0

− ∫ 𝑓𝑥(𝑥)𝑑𝑥 = 1 (ya que la suma de todas las probabilidades debe ser igual a 1)
−∞

La función de distribución o de probabilidad acumulativa es una función tal que a cada número real 𝑡 le
hace corresponder la probabilidad de que la variable tome un valor menor o igual a él:
17

𝑡
𝐹𝑥 = 𝑃(𝑋≤𝑡) = ∫ 𝑓𝑥(𝑥)𝑑𝑥 𝑃(𝑋 > 𝑡) = 1 − 𝐹𝑥(𝑥) = 𝐺𝑥(𝑥)
−∞

En todos los casos se cumple que:


− No puede ser una función decreciente ya que acumula probabilidades
− Es una función continua
− 𝐹𝑥(𝑡) = 0
− 𝐹𝑥(𝑡) = 1
− 𝑃(𝑎 < 𝑋≤𝑏) = 𝐹𝑥(𝑏) − 𝐹𝑥(𝑎) 𝑎 < 𝑏
− 𝑃(𝑋 = 𝑥) = 0 (por ser una variable continua, nunca puede tomar un valor exacto ya que sería discreto)

Percentiles en VAC Moda en VAC



𝑝20 = ∫ 𝑓(𝑥)𝑑𝑥 = 0, 20 No hay un número que más se repita o un valor más
−∞ probable ya que la probabilidad de que la variable
∞ tome un valor en particular es nula.
𝑝50 = ∫ 𝑓(𝑥)𝑑𝑥 = 0, 50
−∞ Por eso, la moda es el máximo de la función de
densidad 𝑓𝑥(𝑥).

Valor esperado o esperanza en VAC Varianza en VAC


∞ ∞
2
𝐸(𝑋) = µ𝑥 = ∫ 𝑥𝑓𝑥(𝑥)𝑑𝑥
−∞
( )
𝑉(𝑋) = ∫ 𝑥 − µ𝑥 𝑓𝑥(𝑥)𝑑𝑥
−∞
2 2
𝑉(𝑋) = 𝐸(𝑋 ) − [𝐸(𝑋)]
Variables aleatorias continuas especiales

Variable aleatoria continua con distribución uniforme


1 𝑥−
𝑋~𝑈(𝑎; 𝑏) 𝑎 < 𝑏 𝑓𝑥(𝑥) = { 𝑏−𝑎 𝑎<𝑥<𝑏 0 𝑒𝑛 𝐹 (𝑥) = {0 𝑥 <𝑎 𝑏−
𝑥
18

2 𝑏−𝑎
𝑏+𝑎 (𝑏−𝑎)
𝐸(𝑋) = 𝑉(𝑋) = σ𝑥 =
2 12 12

Variable aleatoria continua con distribución exponencial

𝑋~𝐸𝑥𝑝(α) (vida útil de cosas que se rompan al azar)


−α𝑥
𝑓𝑥(𝑥) = {α𝑒 𝑥≥0 0 𝑥<0
−α𝑥
𝐹𝑥(𝑥) = {1 − 𝑒 𝑥≥0 0 𝑥< 0
−α𝑥
𝐺𝑥(𝑥) = {𝑒 𝑥≥0 1 𝑥<0

1 1 1
𝐸(𝑋) = 𝑉(𝑋) = 2 σ𝑥 = α
α α
19

Cálculo de la mediana: La probabilidad de que la variable tome valores superiores a su valor


~ ~ esperado es independiente del valor de α:
() ()
𝐹𝑥 𝑥 = 𝐺𝑥 𝑥 = 0, 5
1
~ −α α
𝑒
−α𝑥 ~ ln𝑙𝑛 (0,5)
= 0, 5⇒𝑥 = −α
𝑃(𝑋 > 𝐸(𝑋)) = 𝑃 𝑋 > ( 1
α ) ( )
= 𝐺𝑥
1
α
=𝑒 =
1
𝑒

Variable aleatoria continua con distribución exponencial y proceso de Poisson asociado

Variable aleatoria continua con distribución Weibull

− Cuando 𝑘 = 1, Weibull = exponencial (tasa de fallos constante)


𝑘 𝑘−1 −(α𝑥)
𝑘
− Cuando 𝑘 > 1, la tasa de fallos decrece con el tiempo
𝑓𝑥(𝑥) = {𝑘α 𝑥 𝑒 𝑥≥0
− Cuando 𝑘 < 1, la tasa de fallos crece con el tiempo
− Cuando 𝑘 = 2, Weibull = Rayleigh
20

Variable aleatoria continua con distribución Rayleigh

Variable aleatoria continua con distribución normal


21
22

Recuperatorio Primer Parcial de Probabilidad y Estadística – 2019


Definir claramente las variables o los eventos que se utilicen. Resolver los ejercicios con planteos adecuados
expresados en forma clara. Mencionar propiedades y/o teoremas usados. No escribir en lápiz.
1- Se lanza una moneda tantas veces como indica un dado lanzado previamente. Tanto la moneda como el
dado están equilibrados.
a) Calcular la probabilidad de que salgan ambos lados de la moneda igual número de veces.
b) Analizar si la siguiente proposición es verdadera o falsa. Justificar claramente la respuesta: “Sea B el
evento de que siempre se obtenga cara al tirar la moneda. B es independiente del número que sale
en el dado pues dado un resultado en el dado hay una sola forma de que ocurra B”.
2- La demanda mensual de un producto A es una variable aleatoria X que, a los efectos prácticos, se puede
moldear con una distribución continua uniforme entre 100 y 500 unidades. La demanda mensual de
otro producto B también se puede asociar con una variable aleatoria continua Y con una función de
densidad indicada en la figura. Un comerciante que vende estos productos tiene en su almacén 350
unidades de A y 650 unidades de B al comienzo del mes. La demanda del producto A es independiente
de la de B. ¿Cuál es la probabilidad de que en el mes se vendan todas las unidades de ambos productos?

3- Para un volumen fijo, el número de células sanguíneas rojas es una variable aleatoria de Poisson con un
número promedio de cuatro células para personas de nivel sanguíneo normal y dos para personas
anémicas, cualquiera sea su sexo.
a) Determinar la probabilidad de que el número de células rojas para una persona de nivel sanguíneo
normal sea mayor al valor promedio correspondiente pero no supere en más de un desvío estándar
a dicho valor.
b) La población estudiada de 100 personas tiene las características dadas en la siguiente tabla. Se elige
un análisis al azar y resulta que el conteo es de 2 células rojas ¿cuál es la probabilidad de que resulte
ser una mujer anémica?
Normales Anémicos
Hombres 25 15
Mujeres 20 40
4- Analizar si la siguiente proposición es verdadera o falsa. Si es verdadera, demostrarla; si es falsa dar un
contraejemplo o justificarlo en forma clara.
Si A y B son dos eventos de un mismo espacio muestral, entonces:
𝑃[(𝐴∩𝐵) ∪ (𝐴∩𝐵)] = 𝑃(𝐴) + 𝑃(𝐵) − 2𝑃(𝐴∩𝐵)
23
24
25
26
27
28
29
30
31
32
33

También podría gustarte