Resumen Anual - PyE
Resumen Anual - PyE
Resumen Anual - PyE
Es importante la ubicación en las variables para evaluar correctamente cómo presentar los datos para su
estudio.
Un experimento doble ciego implica aplicar una experimentación a un grupo de dos, pero no hacerle saber a
ninguno de los dos grupos si se les está haciendo la prueba o no. La persona que hace la experimentación
tampoco está enterada. Ejemplo: prueba voluntaria para la vacuna contra el COVID-19.
Las variables cuantitativas se representan gráficamente en gráficos de barra, torta, en función de lo que se
quiera hacer o mostrar, el mensaje que se quiera dejar.
Medidas de tendencia central: cuando el tiempo no interesa, los datos se ordenan de menor a mayor. Datos no
agrupados.
Usa toda la información que proveen los datos. Es de manejo algebraico simple. Es muy
Media o promedio sensible a la presencia de datos extremos.
𝑥1+𝑥2+…+𝑥𝑛
𝑥= 𝑛
Número que está en el medio cuando los registros están ordenados de menor a mayor.
Representa el centro de la distribución. Usa muy poca información de los datos.
Mediana ~ 𝑥𝑘+𝑥𝑘+1
𝑥 = {𝑥𝑘 + 1 𝑠𝑖 𝑛 = 2𝑘 (𝑝𝑎𝑟) 2
𝑠𝑖 𝑛 = 2𝑘 + 1 (𝑖𝑚𝑝𝑎𝑟)
𝑛+1
Posición de la mediana: 2
Cuando cada registro tiene un peso diferente que se debe tener en cuenta (𝑤≥0).
Media ponderada ~ 𝑤1𝑥1+𝑤2𝑥2+…+𝑤𝑛𝑥𝑛
𝑥𝑝𝑜𝑛𝑑𝑒𝑟𝑎𝑑𝑎 = 𝑤1+𝑤2+…+𝑤𝑛
2
Cuando tengo datos atípicos que modifican el promedio y no es real, se recortan los
Media recortada
datos extremos con algún criterio simétricamente.
Medidas de variabilidad o dispersión: indican cuán disperso es el conjunto de datos, cuán cercanos se
encuentran entre ellos.
𝑥𝑚á𝑥 − 𝑥𝑚í𝑛
Rango muestral
𝑖=1
2 1
𝑠 = 𝑛−1 ∑ 𝑥𝑖 − 𝑥
𝑖=1
( )
la media
𝑛 La mayoría de los datos se
Punto de equilibrio: ∑ (𝑥𝑖 − 𝑥) = 0 Desvío
encuentran en este rango:
𝑖=1 estándar
2
𝑠= 𝑠
Los percentiles son otro modo de resumir una distribución muestral o poblacional. El percentil 𝑝% de un
conjunto de datos es la observación que deja a lo sumo 𝑝% de las observaciones a la izquierda de él y a lo sumo
(1 − 𝑝)% a la derecha. Por ejemplo: el percentil 𝑝30 deja al 30% de los datos a la izquierda de ese valor. El
~
percentil 𝑝50 = 𝑥.
Histogramas: pretende mostrar la forma de la distribución de los datos. Datos agrupados en tablas de
frecuencias.
Se debe construir una tabla de frecuencias. Las clases o intervalos de clase de una tabla de frecuencias deben
ser mutuamente excluyentes y exhaustivas, es decir, cada dato debe caer en una y sólo una clase y todos los
datos deben tener una clase a la cual pertenecen. Para construir una tabla de frecuencias:
1. Se divide el rango total de los datos en clases o intervalos (no necesariamente deben tener la misma
longitud).
2. Se cuenta el número de observaciones que cae en cada clase y se determina la frecuencia en cada clase.
3. Se calculan las frecuencias relativas, acumuladas y acumuladas relativas para cada intervalo. 𝑓𝑖 =
número de casos que cae en el intervalo 𝑖-ésimo. La frecuencia acumulada es 𝑓𝑎𝑖 = 𝑓1 + 𝑓2 + … + 𝑓𝑖 =
suma de las frecuencias desde la primera categoría hasta la categoría 𝑖-ésima.
4
Se pueden tomar las medidas numéricas descriptivas de un conjunto de datos agrupados en clases. Si el
*
conjutno de 𝑛 datos se ha agrupado en un número de 𝑘 clases, sea 𝑥𝑖 la marca de la 𝑖-ésima clase y 𝑓𝑖 la
𝑘
frecuencia de la 𝑖-ésima clase, de modo que 𝑛 = ∑ 𝑓𝑖. El valor aproximado de la media muestral de los datos
𝑖=1
𝑘
1 *
agrupados es 𝑥𝑠 = 𝑛
∑ 𝑓𝑖𝑥𝑖 .
𝑖=1
Para los datos agrupados es necesario determinar la clase que contiene el valor de la mediana para después
determinar el valor de la mediana dentro de la clase mediante interpolación. La clase que contiene la
mediana es la primera cuya frecuencia acumulada iguala o excede la mitad del total de observaciones. Para
( )
𝑚−1
~ 1 𝑛
calcular el valor exacto de la mediana una vez que se la ubicó en la clase: 𝑥𝑠 = 𝐿𝑖(𝑚) + 𝑓 . 2 − ∑ 𝑓𝑖 . 𝑙𝑚.
𝑚 𝑖=1
Donde 𝐿𝑖(𝑚)es el límite inferior de la clase que contiene la mediana, 𝑛 es el número total de observaciones en la
𝑚−1
distribución de frecuencias, ∑ 𝑓𝑖 es la sumatoria de las frecuencias de todas las clases por debajo de la clase
𝑖=1
que contiene a la mediana, 𝑓𝑚 es la frecuencia de la clase de la mediana y 𝑙𝑚es el tamaño del intervalo de la clase
de la mediana.
Para determinar los percentiles y cuartiles en los datos agrupados, en primer lugar se determina la clase que
contiene el punto de interés, de acuerdo con las frecuencias acumuladas y luego se lleva a cabo una
interpolación como se hizo para el caso de la mediana. Por ejemplo, el primer cuartil se calcula como:
( )
𝑞−1
1 𝑛
𝑄1 = 𝐿𝑖(𝑞) + 𝑓𝑞
. 4
− ∑ 𝑓𝑖 . 𝑙𝑞
𝑖=1
5
Donde 𝐿𝑖(𝑞) es el límite inferior de la clase que contiene al primer cuantil, 𝑛 es el número total de observaciones
𝑞−1
en la distribución de frecuencias, ∑ 𝑓𝑖 es la suma de las frecuencias de todas las clases por debajo de la clase
𝑖=1
del primer cuantil, 𝑓𝑞 es la frecuencia de la clase del cuantil y 𝑙𝑞 es el tamaño del intervalo de dicha clase.
− Continuo. Por ejemplo, horas de uso de un foco de luz (entre dos números reales hay infinito números);
la altura real de una persona; se toma un cubito de agua y se registra el tiempo que pasa hasta que se
derrita completamente bajo condiciones prefijadas de experimentación; etc.
A su vez, se pueden categorizar como eventos compuestos o simples. Por ejemplo, se arroja un dado y se
observa qué número aparece en la cara superior, E = {1; 2; 3; 4; 5; 6}. Que salga el número 4 se denomina evento
simple, lo cual puede definirse por extensión o enumeración, A = {4}, o por comprensión, A: sale el número 4. En
cambio, que salga un número par se trata de un evento compuesto, B = {2; 4; 6}, B: sale un número par.
Operaciones con eventos – Teoría de Conjuntos
Diagrama de Venn (la probabilidad del evento no se asocia al tamaño del conjunto en el gráfico).
A = {4}
B = {2; 4; 6}
C = {3; 4; 5; 6}
D = {1; 2; 3}
F = {1; 2; 3; 4; 5; 6}
𝐶 '
Evento en el espacio muestral (Sucede A) Complemento de A (𝐴 = 𝐴 = 𝐴 = no sucede A)
A y B ocurren simultáneamente, suceden ambos Sucede por lo menos uno de los dos eventos, es
eventos, tanto A como B. decir, sucede A o B.
8
Leyes de Morgan
− Asignación para el caso de un espacio muestral finito y equiprobable o por Regla de Laplace. Solo
puede ser utilizado para espacios muestrales con eventos equiprobables, 𝐴⊂𝐸, por lo tanto:
𝐶𝑎𝑛𝑡𝑖𝑑𝑎𝑑 𝑑𝑒 𝑐𝑎𝑠𝑜𝑠 𝑓𝑎𝑣𝑜𝑟𝑎𝑏𝑙𝑒𝑠 𝑎 𝐴 𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑒𝑣𝑒𝑛𝑡𝑜𝑠 𝑒𝑞𝑢𝑖𝑝𝑟𝑜𝑏𝑎𝑏𝑙𝑒𝑠 𝑞𝑢𝑒 𝑠𝑒 𝑐𝑜𝑛𝑠𝑖𝑑𝑒𝑟𝑎 𝑑𝑜𝑛𝑑𝑒 𝐴 𝑠𝑢𝑐𝑒𝑑𝑒
𝑃(𝐴) = 𝐶𝑎𝑛𝑡𝑖𝑑𝑎𝑑 𝑑𝑒 𝑐𝑎𝑠𝑜𝑠 𝑝𝑜𝑠𝑖𝑏𝑙𝑒𝑠 𝑒𝑛 𝐸 = 𝑁ú𝑚𝑒𝑟𝑜 𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑒𝑣𝑒𝑛𝑡𝑜𝑠 𝑒𝑞𝑢𝑖𝑝𝑟𝑜𝑏𝑎𝑏𝑙𝑒𝑠 𝑞𝑢𝑒 𝑠𝑒 𝑐𝑜𝑛𝑠𝑖𝑑𝑒𝑟𝑎𝑛 𝑒𝑛 𝐸
Probabilidad Conjunta
Por ejemplo, las bolillas pueden ser rojas (R) o negras (N) e impares (I) o pares (A).
Probabilidad Condicional
( ) + 𝑃( ) = 1
Donde 𝑃
𝐴
𝐵
𝐴
𝐵
Donde 𝑃(𝐵/𝐴) + 𝑃 ( )= 1
𝐵
𝐴
⊂𝐸, 𝐵⊂𝐸 𝑐𝑜𝑛 𝑃(𝐴) > 0, 𝑃(𝐵) > 0⟹𝑃(𝐵∩𝐴) = 𝑃 ( ). 𝑃(𝐵) = 𝑃( ). 𝑃(𝐴)
𝐴
𝐵
𝐵
𝐴
Si el experimento fuese con reposición, cada vez volvería a comenzar como en la primera extracción, el
resultado de las extracciones subsiguientes a la primera es independiente de cualquier resultado anterior.
Si la población es grande y el número de extracciones no supera al 5% de la especie menos numerosa, si el
experimento se realiza con reposición o sin reposición resulta que las probabilidades de un mismo evento dan
prácticamente lo mismo en ambas operativas.
𝑚!
Variaciones simples de m elementos tomados 𝑉𝑚,𝑛 = (𝑚−𝑛)!
𝑚≤𝑛, 𝑚∈𝑁0, 𝑛∈𝑁0
de a n
Teorema de Bayes
12
∑ 𝑃(𝐵/𝐴𝑖)𝑃(𝐴𝑖)
𝑗 = 1, 2, …, 𝑛
𝑃(𝐵)≠0. 𝑖=1
Sean A y B dos eventos de probabilidad no Los eventos excluyentes (A y B no pueden suceder al mismo
nula dentro de un espacio muestral E, son tiempo) no pueden ser independientes, son dependientes.
estadísticamente independientes si
Si dos eventos A y B son independientes, 𝐴 𝑦 𝐵 también lo son.
𝐴
( )
𝑃 𝐵 = 𝑃(𝐴) 𝑃(𝐴/𝐵) = 𝑃(𝐴)
𝑃 ( )=
𝐴 𝑃(𝐴∩𝐵)
( ) = 𝑃(𝐴); 𝑃(
𝐵
⇒𝑃(𝐴) =
𝑃(𝐵)
𝑃(𝐴∩𝐵) 𝑃
𝐴
𝐵
𝐴
𝐵 ) = 𝑃(𝐴)
( ) = 𝑃(𝐴); 𝑃(𝐴/𝐵) = 𝑃(𝐴)
𝑃(𝐵) 𝐴
⇒𝑃(𝐴∩𝐵) = 𝑃(𝐴). 𝑃(𝐵) ⇒𝑃
𝐵
( ) = 𝑃(𝐵); 𝑃(
𝑃
𝐵
𝐴
𝐵
𝐴 ) = 𝑃(𝐵)
⇒𝑃 ( ) = 𝑃(𝐵); 𝑃(𝐵/𝐴) = 𝑃(𝐵)
𝐵
𝐴
𝑃(𝐴∩𝐵∩𝐶) = 𝑃(𝐴). 𝑃(𝐵). 𝑃(𝐶)
Tres eventos independientes de a pares Si el conjunto no es igual al producto de los marginales, no son
independientes.
Conexión en paralelo
Conexión en serie
En un sistema en serie, si funciona el sistema (NO falla), todas las partes del sistema funcionan (NO fallan)
en forma simultánea.
( )
𝑃(𝑆) = 1 − 𝑃(𝑆) = 𝑃 𝐴1 ∩ 𝐴2 ∩ 𝐴3∩…∩𝐴𝑛 ⟹𝑃(𝑆) = 1 − 𝑃 𝐴1 ∩ 𝐴2 ∩ 𝐴3∩…∩𝐴𝑛 ( )
Si cada componente funciona/falla en forma independiente de las demás:
( ) ( ) ( )
𝑃(𝑆) = 1 − ⎡⎢𝑃 𝐴1 . 𝑃 𝐴2 . 𝑃 𝐴3 . … . 𝑃 𝐴𝑛 ⎤⎥
⎣ ⎦ ( )
( ) ( ) ( )
⇒𝑃(𝑆) = 1 − {[(1 − 𝑃 𝐴1 ]. [(1 − 𝑃 𝐴2 ]. [(1 − 𝑃 𝐴3 ]. … . [(1 − 𝑃 𝐴𝑛 ]} ( )
Si además todas las componentes tienen la misma probabilidad de falla:
𝑛 𝑛
𝑃(𝑆) = 1 − (1 − 𝑝) 𝑦 𝑃(𝑆) = (1 − 𝑝) , ( )
𝑠𝑖 𝑃 𝐴𝑖 = 𝑝 ∀𝑖
Dada una variable aleatoria discreta 𝑋 con recorrido 𝑅𝑥 y valor esperado µ𝑥, se llama
varianza de 𝑋 al número no negativo:
Varianza
[ 2
] 2
( 2
) 2
𝑉(𝑋) = 𝐸 (𝑋 − 𝐸(𝑋)) = ∑ ⎡⎢ 𝑥 − µ𝑥 . 𝑝(𝑥)⎤⎥ = ∑ ⎡⎢ 𝑥 − 2𝑥µ𝑥 + µ𝑥 . 𝑝(𝑥)⎤⎥ =
𝑥=𝑅 ⎣ 𝑥
⎦ 𝑥=𝑅 ⎣ ⎦
𝑥
( )
2
2 2
(𝑉(𝑋) = σ𝑥)
[ ]
∑ 𝑥 . 𝑝(𝑥) − 2µ𝑥 ∑ [𝑥. 𝑝(𝑥)] + µ𝑥 ∑ [𝑝(𝑥)] = 𝐸 𝑋 ( 2) − 2𝐸(𝑋)𝐸(𝑋) + [𝐸(𝑋)]2
𝑥=𝑅𝑥 𝑥=𝑅𝑥 𝑥=𝑅𝑥
𝑉(𝑋) = 𝐸 𝑋 ( 2) − [𝐸(𝑋)]2
Desvío estándar = σ𝑥 = 𝑉(𝑋)
14
Probabilidad 𝑃(𝑋 = 𝑥) =
𝑛!
(𝑛−𝑥)!𝑥!
𝑥
𝑝 (1 − 𝑝)
𝑛−𝑥
= ( )𝑝 (1 − 𝑝)
𝑛
𝑥
𝑥 𝑛−𝑥
𝐸(𝑋) = 𝑛𝑝
Valor esperado
𝑉(𝑋) = 𝑛𝑝(1 − 𝑝) σ𝑥 = 𝑛𝑝(1 − 𝑝)
Varianza
Cuándo se Cuenta la cantidad de fracasos que hubo previos al éxito nº 𝑟. La cantidad de éxitos es fija.
utiliza
𝑟(1−𝑝)
Valor esperado 𝐸(𝑋) = 𝑝
𝑟(1−𝑝)
Varianza 𝑉(𝑋) = 2 σ𝑥 =
𝑟(1−𝑝)
𝑝 2
𝑝
Cuándo se Cuando tomamos una pequeña muestra de una gran población. Tiende a ser una variable
utiliza Binomial mientras más grande sea la población. Extracciones sin reposición.
𝑃(𝑋 = 𝑥) =
( ).( )
𝑀
𝑥
𝑁−𝑀
𝑁−𝑥
Probabilidad
( ) 𝑁
𝑛
𝑀
Valor esperado 𝐸(𝑋) = 𝑛 𝑁
Varianza 𝑉(𝑋) = 𝑛
𝑀
𝑁 ( 𝑁−𝑛
𝑁−1 )(1 − ) 𝑀
𝑁 σ𝑥 = 𝑛
𝑀
𝑁 ( 𝑁−𝑛
𝑁−1 )(1 − )
𝑀
𝑁
Cuando se repite un ensayo Bernoulli hasta obtener el primer éxito. Cuenta la cantidad de
Cuándo se
fracasos que hay antes del primer éxito. Es un caso particular de la binomial negativa
utiliza
(fracasos)/Pascal (ensayos) cuando 𝑟 = 1.
𝑥−1 𝑛 𝑛
Probabilidad 𝑃(𝑋 = 𝑥) = (1 − 𝑝) 𝑝 𝐹𝑥(𝑛) = 𝑃(𝑋≤𝑛) = 1 − (1 − 𝑝) 𝑃(𝑋 > 𝑥) = (1 − 𝑝)
16
1
Valor esperado 𝐸(𝑋) = 𝑝
1−𝑝 1−𝑝
Varianza 𝑉(𝑋) = 2 σ𝑥 = 2
𝑝 𝑝
Cuándo se Cuando se realiza un ensayo hasta que se obtengan una determinada cantidad de éxitos
utiliza especificada.
Probabilidad 𝑃(𝑋 = 𝑥) = ( )𝑝 (1 − 𝑝)
𝑥−1
𝑟−1
𝑟 𝑥−𝑟
1
Valor esperado 𝐸(𝑋) = 𝑟 𝑝
1−𝑝
Varianza 𝑉(𝑋) = 𝑟 2 σ𝑥 = 𝑟
1−𝑝
𝑝 2
𝑝
Cuando estamos contando cuantas veces sucede algo en un determinado tiempo / longitud
/ área / volumen. Es una aproximación de una variable aleatoria Binomial cuando 𝑛 es muy
grande y 𝑝 muy pequeño (λ = 𝑛𝑝→ tiende a infinito).
Cuándo se
utiliza Explicación: se puede particionar el tiempo/espacio total en intervalos en donde la
probabilidad de que suceda es igual en cada intervalo. Si sucede en un intervalo o no, no
afecta a lo que suceda en los demás. No pueden suceder dos cosas en el mismo intervalo;
sucede o no sucede.
−λ 𝑥
𝑒 λ
Probabilidad 𝑃(𝑋 = 𝑥) = 𝑥!
𝐸(𝑋) = µ𝑥 = λ
Valor esperado
2
Varianza 𝑉(𝑋) = σ𝑥 = λ
La función de distribución o de probabilidad acumulativa es una función tal que a cada número real 𝑡 le
hace corresponder la probabilidad de que la variable tome un valor menor o igual a él:
17
𝑡
𝐹𝑥 = 𝑃(𝑋≤𝑡) = ∫ 𝑓𝑥(𝑥)𝑑𝑥 𝑃(𝑋 > 𝑡) = 1 − 𝐹𝑥(𝑥) = 𝐺𝑥(𝑥)
−∞
2 𝑏−𝑎
𝑏+𝑎 (𝑏−𝑎)
𝐸(𝑋) = 𝑉(𝑋) = σ𝑥 =
2 12 12
1 1 1
𝐸(𝑋) = 𝑉(𝑋) = 2 σ𝑥 = α
α α
19
3- Para un volumen fijo, el número de células sanguíneas rojas es una variable aleatoria de Poisson con un
número promedio de cuatro células para personas de nivel sanguíneo normal y dos para personas
anémicas, cualquiera sea su sexo.
a) Determinar la probabilidad de que el número de células rojas para una persona de nivel sanguíneo
normal sea mayor al valor promedio correspondiente pero no supere en más de un desvío estándar
a dicho valor.
b) La población estudiada de 100 personas tiene las características dadas en la siguiente tabla. Se elige
un análisis al azar y resulta que el conteo es de 2 células rojas ¿cuál es la probabilidad de que resulte
ser una mujer anémica?
Normales Anémicos
Hombres 25 15
Mujeres 20 40
4- Analizar si la siguiente proposición es verdadera o falsa. Si es verdadera, demostrarla; si es falsa dar un
contraejemplo o justificarlo en forma clara.
Si A y B son dos eventos de un mismo espacio muestral, entonces:
𝑃[(𝐴∩𝐵) ∪ (𝐴∩𝐵)] = 𝑃(𝐴) + 𝑃(𝐵) − 2𝑃(𝐴∩𝐵)
23
24
25
26
27
28
29
30
31
32
33