Tratamiento de Datos y Azar Cona
Tratamiento de Datos y Azar Cona
Tratamiento de Datos y Azar Cona
UNIDAD 5
ESTADISTICA Y PROBABILIDAD
SIN FERTILIZANTE
CON FERTILIZANTE
Es importante considerar:
• ¿Se puede indicar claramente el problema que el agricultor quiere
resolver?
• ¿Cómo ha tratado el agricultor de hacer una comparación justa?
• ¿Cómo podría el agricultor asegurarse de que su selección fue
aleatoria?
• ¿Cuál es la mejor forma de organizar estos datos?
• ¿Cuáles son los métodos adecuados de la visualización de los datos?
• ¿Existen resultados anormalmente altos o bajos y cómo deben ser
tratados?
• ¿Cómo podemos describir el tamaño típico?
• ¿Cómo podemos describir la propagación de posibles tamaños?
• ¿Puede el agricultor hacer una conclusión razonable a partir de su
investigación?
• Los valores atípicos - valores de datos que son ya sea mucho mayor o
mucho menor que el cuerpo general de datos; que deben ser
incluidos en el análisis a menos que sean el resultado de un error
humano.
Una variable numérica discreta toma valores numéricos exactos y es a menudo el resultado de
contar.
Una variable continua toma valores numéricos dentro de un cierto rango continuo. Por lo
general es el resultado de la medición.
• La altura de los estudiantes: la variable puede tomar cualquier valor de alrededor de 140
cm a 200 cm.
• La velocidad de los coches en un tramo de la carretera: la variable puede tomar
cualquier valor de 0 km / h a 200 km / h .
Desde cursos anteriores usted debe estar familiarizado con los gráficos de columnas que se
utilizan para mostrar variables numérica discreta
Cuando se recolectan datos para una variable continua es probable que sean muchos valores
diferentes. Organizamos los datos en una tabla de frecuencias agrupando en intervalos de clase
de la misma anchura.
Un tipo especial de gráfico que se denomina histograma de frecuencias o simplemente
histograma se utiliza para mostrar los datos. Este es similar a un gráfico de columnas pero, para
tener en cuenta la naturaleza continua de la variable, es una línea de números utilizados para el
eje horizontal y se unen entre sí las 'columnas'.
EJEMPLO 1
Una muestra de 20 langostas se selecciona aleatoriamente de un tanque que contiene varios
cientos.
Cada langosta se ha medido la longitud (en cm) y los resultados son:
a. Organizar los datos utilizando una tabla de frecuencias, y representar gráficamente los
datos.
b. establece la clase modal para los datos.
c. Describe la distribución de los datos.
2. Una escuela ha llevado a cabo una encuesta a 60 estudiantes para investigar el tiempo
que toman para viajar a la escuela. Los siguientes datos muestran los tiempos de viaje
al minuto más cercano:
LA MODA
Para los datos numéricos discretos, la moda es el valor que ocurre con mayor frecuencia en el
conjunto de datos.
Para los datos numéricos continuos, no podemos hablar de una moda de esta manera porque no
hay dos valores de los datos serán exactamente iguales. En su lugar se habla de una clase
modal, que es la clase o grupo que se presenta con mayor frecuencia.
LA MEDIA
La media nos da un solo número que indica el centro del conjunto de datos. Por lo general no es
un miembro del conjunto de datos.
LA MEDIANA
Para las distribuciones que son simétricas con respecto al centro, la media y la mediana serán
aproximadamente iguales.
Si el conjunto de datos tiene simetría, tanto la media como la mediana se deben medir con
precisión el centro de la distribución.
Tenga en cuenta que la media y la mediana son claramente diferentes para estas distribuciones
asimétricas.
Para describir con precisión una distribución tenemos que medir tanto su centro y su
propagación o dispersión.
Las distribuciones que se muestran tienen la misma media, pero claramente tienen diversas
extensiones. La distribución A tiene más puntuaciones cercanas a la media mientras que la
distribución C tiene la mayor difusión.
Examinaremos cuatro medidas diferentes de propagación: el rango, el rango intercuartil (IQR), la
varianza, y la desviación estándar.
RANGO
El rango es la diferencia entre el máximo (más grande) y el mínimo (el más pequeño)
valor de datos.
La mediana divide los datos ordenados establecidos en dos mitades y estas mitades se dividen
por la mitad otra vez por los cuartiles.
El valor medio de la mitad inferior se llama el cuartil inferior o percentil 25. Una cuarta parte o el
25% de los datos tienen valores inferiores o iguales al cuartil inferior.
El 75% de los datos tienen valores superiores a o igual que el cuartil inferior.
El valor medio de la mitad superior se llama el cuartil superior o percentil 75. Una cuarta parte o
el 25% de los datos tienen valores mayores que o iguales a él cuartil superior. 75% de los datos
tienen valores menores que o igual que el cuartil superior. El rango intercuartil es la gama de la
mitad central o 50% de los datos.
El conjunto de datos se divide así en cuartos por el cuartil inferior (Q1), la mediana (Q2), y la
parte superior cuartil (Q3).
IQR = Q3 − Q1
El rango intercuartil no se ve afectado por valores muy bajos o muy altos de datos, ya que estos
se encuentran fuera la media del 50% de los valores de los datos.
EJEMPLO 2
Para el siguiente grupo de datos:
2. Los tiempos (en minutos) de 20 personas esperando en una cola de un cajero fueron:
3. Se registraron las alturas de 20 niños de diez años (en cm) de la siguiente manera:
a. Hallar:
i. La mediana de la altura ii. Cuartiles superior e inferior
• EL VALOR MINIMO
• CUARTIL INFERIOR Q1
• LA MEDIANA Q2
• CUARTIL SUPERIOR Q3
• EL VALOR MÁXIMO
Para el conjunto de datos del ejemplo 2 pagina 21, los 5 valores anteriores serian:
Mínimo= 1
Q1= 4
Mediana= 6
Q3= 9.5
Máximo= 15
Un conjunto de datos con una distribución simétrica tendrá un diagrama de caja simétrica.
Los bigotes del diagrama de caja tienen la misma longitud y la línea media está en el centro de
la caja.
EJEMPLO
CONSIDERA EL SIGUIENTE GRUPO DE DATOS:
Los valores atípicos son datos extraordinarios que están separadas del cuerpo principal de los
datos.
Los valores atípicos son ya sea mucho mayor o mucho más pequeña que la mayoría de los datos.
Un ensayo comúnmente utilizado para identificar valores atípicos implica el cálculo de los
límites superior e inferior:
1.
a. El diagrama de caja resume los puntos marcados por un equipo de baloncesto. Busque:
i. mediana ii. Valor máximo iii. Valor mínimo iv. Cuartil superior
v. cuartil inferior
2.
El diagrama de caja resume los resultados de la clase de una prueba de 100 puntos.
a. Hallar el rango del conjunto de datos.
b. Hallar el rango intercuartil.
4. Enid examina una nueva variedad de frijol y cuenta el número de granos en 33 vainas. Sus
resultados fueron:
5. Un conjunto de datos tiene un cuartil inferior de 31.5, una mediana de 37, y un cuartil
superior de 43.5.
a. Calcular el rango intercuartil para este conjunto de datos.
b. Calcular los límites que identifican los valores atípicos.
c. ¿Cuál de los datos 22, 13.02, 60, 65 serían los valores atípicos?
14 PUNTOS
14 PUNTOS
Los tiempos empleados por el grupo de chicas para completar la carrera se muestran en la
siguiente tabla.
13 PUNTOS
PERCENTILES
Un percentil es el puntaje que un cierto porcentaje de los datos se encuentra en o por debajo.
POR EJEMPLO:
Un gráfico de frecuencia acumulada proporciona una manera conveniente para encontrar los
percentiles.
2. Los siguientes datos muestran las longitudes de 30 truchas atrapadas en un lago durante una
competencia de pesca. Las mediciones se redondean hacia abajo en centímetros.
El problema con el uso de la gama y la IQR como medidas de difusión o dispersión de las
puntuaciones es que dos de ellos sólo usan dos valores en su cálculo. Por tanto, algunos
conjuntos de datos pueden tener sus características de propagación ocultos cuando se citan el
rango o la IQR, por lo que necesitamos una mejor manera de describir la propagación.
En su lugar, se define:
n
( xi − x ) 2
S n2 = i =1
La varianza de una muestra de valores de datos n es:
n
Observe que en esta fórmula:
n
( xi − x) 2
Sn = i =1
Para un conjunto de datos de valores de n,
n es
EJEMPLO 1
Consideremos de nuevo los datos de la Encuesta de la biblioteca del ejemplo 6.
2. El número de puntos anotados por Andrew y Brad en los últimos 8 partidos de baloncesto se
tabulan a continuación.
a. Encuentre la media y la desviación estándar del número de puntos alcanzados por cada
jugador.
b. ¿Cuál de los dos jugadores es más consistente?
Una vez más, se espera utilizar la tecnología para el cálculo de la desviación estándar en este
curso. Utilizamos la fórmula en el siguiente ejemplo para ayudar a la comprensión solamente.
n
f i ( xi − x) 2
Sn = i =1
n
EJEMPLO 1
HALLAR LA DESVIACION ESTANDAR DE LA DISTRIBUCION EMPLEANDO:
a. La fórmula de desviación estándar
b. Tecnología
1. A continuación se muestra un ejemplo del tamaño de las familias tomadas al azar de la gente
en una ciudad.
2. A continuación se presenta una muestra aleatoria de las edades de los jugadores de squash en
el Campeonato Nacional de Squash.
PROBLEMA DE APERTURA.
En un torneo juvenil, un grupo de jóvenes atletas lanzan un disco. La edad y la distancia de
lanzamiento son registradas para cada atleta.
ES IMPORTANTE CONSIDERAR:
a. ¿Crees que la distancia que un atleta puede lanzar está relacionada a la edad de la
persona?
b. ¿Cómo se puede representar gráficamente los datos para que podamos ver claramente
la relación entre las variables?
c. ¿Cómo podemos medir la relación entre las variables?
d. ¿Cómo podemos usar estos datos para predecir la distancia de lanzamiento que un
atleta de 14 años puede lograr?
DIRECCION
Por lo general una tendencia al alza, se dice
que la correlación es positiva.
Un aumento en la variable independiente
significa que la variable dependiente
generalmente aumenta.
LINEALIDAD
Estos puntos son más o menos lineales
POSITIVA FUERTE
MODERADA
POSITIVA MODERADA
DÉBIL
POSITIVA DÉBIL
FUERTE
NEGATIVA FUERTE
MODERADA
NEGATIVA MODERADA
DÉBIL
NEGATIVA DÉBIL
VALORES EXTREMOS
(ATÍPICOS)
EXTREMO
NO EXTREMO
En la sección anterior, clasificamos la fuerza de la correlación entre dos variables, ya sea como
fuerte, moderada o débil. Hemos observado los puntos en un diagrama de dispersión, e hicimos
un juicio en cuanto a la claridad con los puntos forman una relación lineal.
Sin embargo, este método puede ser bastante inexacto, por lo que es importante obtener una
medida más precisa de la fuerza de correlación lineal entre dos variables. Logramos esto
utilizando producto-momento de Pearson el coeficiente de correlación r.
( x − x)( y − y )
r=
( x − x ) 2 ( y − y ) 2
Donde x e y son las medias de las x y respectivamente, y significa la suma sobre
todos los valores.
El rango de valores de r es -1 a +1
EJEMPLO 2
Un grupo de adultos se pesa, y miden su velocidad máxima en la pista:
a. hallar r.
b. describe la correlación entre el peso y la velocidad.
2. La tabla muestra las edades de cinco niños, y el número de veces que visitó el médico en el
último año:
3. Jill cuelga su ropa a secar todos los sábados, y se da cuenta que la ropa se seca más
rápidamente algunos días que otros. Ella investiga la relación entre la temperatura y el tiempo
de secado de su ropa.
Hemos visto que hay una correlación fuerte lineal positiva entre la edad y la distancia de
lanzamiento.
Por tanto, podemos modelar los datos utilizando una línea de mejor ajuste.
La línea formada se llama una línea de mejor ajuste a ojo. Esta línea puede variar de persona a
persona.
EJEMPLO 1
CONSIDERA LOS SIGUIENTES DATOS REFERENTES A LA MASA DE UN RESORTE.
El problema con el empleo de una línea de mejor ajuste a ojo es que la línea trazada variará
de una persona a otra.
En su lugar, se utiliza un método conocido como la regresión lineal para encontrar la
ecuación de la recta que mejor se ajusta a los datos. El método más común es el método de
"mínimos cuadrados”.
En la práctica, en lugar de encontrar la recta de regresión por experimentación, usamos una
calculadora o un paquete de estadísticas.
Supongamos que hemos recogido datos para investigar la asociación entre dos variables.
Obtenemos el diagrama de dispersión que se muestra a continuación. Los datos con los
valores más bajos y más altos de x se llaman polos.
Utilizamos la línea de regresión de mínimos cuadrados para estimar que valores de una
variable dan un valor para la otra.
Si usamos los valores de x entre los polos, que decimos que la interpolación entre los polos.
Si usamos los valores de x fuera de los polos, decimos estamos extrapolando fuera de los
polos.
La precisión de una interpolación depende que tan lineal sea la relación entre los datos
originales. Esto puede ser calibrado mediante la determinación del coeficiente de
correlación y asegurar que los datos son dispersos al azar alrededor de la línea de regresión
lineal.
La precisión de una extrapolación depende no sólo de la forma lineal de los datos originales,
sino también del supuesto de que la tendencia lineal continuará más allá de los polos. La
validez de este supuesto depende en gran medida de la situación que estamos viendo.
Como regla general, es razonable interpolar entre los polos, pero poco fiable extrapolar
fuera los polos.
Por ejemplo, podemos ver que fuera de 100 000 nacimientos, 98 052 hombres se espera que
sobrevivan a la edad de 20 años, y a partir de esa edad los sobrevivientes esperan vivir otros
54.35 años.
a. ¿Se puede utilizar la tabla de vida para estimar el número de años que se puede esperar
vivir?
b. ¿Se puede estimar la probabilidad de que un niño o niña recién nacido llegue a la edad
de 15 años?
c. ¿ puede la tabla utilizarse para estimar la probabilidad de que:
i. un niño de 15 años pueda llegar los 75 años
ii. una niña de 15 años no alcanzará los 75 años ?
d. Una compañía de seguros vende pólizas a las personas para asegurar contra la muerte
en un período de 30 años. Si la persona muere durante este período, los beneficiarios
reciben la acordada cifra del pago. ¿Por qué con estas políticas más barato asegurar una
persona de 20 años de edad que para una de 50 años de edad?
Asignamos a cada evento un número que se encuentra entre 0 y 1, ambos inclusive. Llamamos a
este número una probabilidad.
Por ejemplo, cuando un pequeño cono de plástico fue lanzado al aire 279
veces; cayó de su lado 183 veces y en su base 96 veces.
Nosotros decimos:
ESPACIO MUESTRAL
Un espacio muestral U es el conjunto de todos los posibles resultados de un experimento.
También se conoce como el conjunto universal U.
DIAGRAMAS DE ARBOL
El espacio muestral en el Ejemplo 1 también podría ser representado por un diagrama
de árbol. La ventaja de los diagramas árbol es que se pueden usar cuando más de dos
operaciones están involucradas.
EJEMPLO 2
ILUSTRAR, USANDO UN DIAGRAMA DE ÁRBOL, LOS POSIBLES RESULTADOS CUANDO:
a. SE LANZAN DOS MONEDAS
b. ESCOGER DOS CANICAS DE UNA BOLSA CON CANICAS ROJAS, VERDES Y AMARILLAS.
b. lanzar una moneda y girando una ruleta de triángulo equilátero con la etiqueta A, B y C
La ruleta es simétrica, cuando se hace girar la flechas del marcador podría terminar con la misma
probabilidad en cada una de las secciones marcada 1 a 8.
• 1 oportunidad de 8
1
•
8
1
• 12 o
2 o
Esta es una probabilidad matemática o teórica y se basa en lo que teóricamente esperamos que
se produzca.
n( A)
P( A) =
n(U )
EJEMPLO 1
UN TICKET ES SELECCIONADO AL AZAR DE UNA CESTA QUE CONTIENE 3 VERDES, 4 AMARILLOS
Y 5 AZULES. DETERMINE LA PROBABILIDAD DE OBTENER:
a. Un ticket verde b. un ticket verde o amarillo c. un ticket naranja
d. un ticket amarillo o azul
P( A) + P( A) = 1
EJERCICIO 1.
1. Una canica es seleccionada al azar de una caja que contiene 5 verdes, 3 rojas y 7 azules.
Determinar la probabilidad de que la canica sea:
3. ¿Cuál es la probabilidad de que una persona elegida al azar tiene su próximo cumpleaños:
a. un martes
b. en un fin de semana
c. en julio
d. en enero o febrero?
EJEMPLO 1. Utilice una red o cuadricula bidimensional para ilustrar el espacio muestral al
lanzar una moneda y tirando un dado simultáneamente. De esta red determinar la
probabilidad de:
1 Dibuja la cuadrícula del espacio muestral cuando una de 5 centavos y una moneda de 10
centavos son lanzados simultáneamente. Por lo tanto determinar la probabilidad de obtener:
a. Dos caras b. dos sellos c. exactamente una cara d. al menos una cara.
i. un sello y un 3
3. Un par de dados se lanzan. Los 36 posibles resultados diferentes se ilustran en la red bi-
dimensional.
a. dos 3 b. un 5 y un 6
c. un 5 o un 6 (o ambos) d. al menos un 6
Por ejemplo, se pidió a un grupo de profesores que informaran sobre el medio de transporte
que utilizan para viajar a la escuela. Sus respuestas se resumen en la siguiente tabla. Las
variables son el sexo y el medio de transporte.
EJEMPLO 1
SE LES PREGUNTA A LAS PERSONAS QUE SALEN DE UN NUEVO PASEO EN UN PARQUE
TEMÁTICO SI LES GUSTÓ O EL PASEO. LOS RESULTADOS SE MUESTRAN EN LA TABLA.
a. asistió a la universidad
c. está desempleado
a. en temporada alta
b. de habitación individual en temporada baja
c. habitación individual o habitación doble
d. familiar, ya que fue en la temporada baja
e. en la temporada alta, ya que no era una habitación individual.
En esta sección buscamos un método más rápido para encontrar la probabilidad de tal
situación.
ANÁLISIS 1.
Supongamos que se lanzan una moneda y un dado al mismo tiempo. El resultado de la
moneda se llamará A, y el resultado de la tirada será B.
QUE HACER:
1 Copia y completa, utilizando una cuadrícula de 2 dimensiones, si es necesario:
De las investigacion1, parece que si A y B son dos eventos para los cuales la ocurrencia de
cada una no afecta a la ocurrencia del otro, entonces P (A y B) = P (A) x P (B).
Antes de que podamos formalizar esto como una regla, sin embargo, tenemos que distinguir
entre eventos independientes y dependientes.
Así, los dos eventos "una bola azul de X" y "una bola roja de Y" son independientes.
Por ejemplo: si A, B y C son sucesos independientes entonces; P(A y B y C)= P(A) x P(B) x P(C).
a. cara, después cara, después cara. b. cruz, después cara, después cruz
4 Una pareja quiere 4 hijos, ninguno de los cuales se adoptarán. Ellos se sentirán
decepcionados si los niños no nacen en el orden chico, chica, chico, chica. Determinar la
probabilidad de que van a ser:
5. Dos tiradores disparan a un objetivo al mismo tiempo. Jack acierta en el objetivo del 70%
todo el tiempo y Diana acierta 80% todo el tiempo.
a. todo el tiempo
Una vez que se ilustra el espacio de muestra, el diagrama de árbol puede ser utilizado para la
determinación de las probabilidades.
Considere que dos arqueros disparaban simultáneamente a un blanco. Estos son eventos
independientes.
H= hit
M= miss
EJEMPLO 4. Dos cajas contienen cada uno 6 plantas de petunia que aún no están en flor. La
caja “A” contiene 2 plantas que tendrá flores de color púrpura y 4 plantas que tienen flores
blancas. “B” contiene 5 plantas que tendrá flores moradas y 1 planta que tendrá flores
blancas. Una caja se selecciona lanzando una moneda, y una planta se retira al azar de la
misma. Determinar la probabilidad de que tendrá flores de color púrpura.
i. Es un oficial
5. Una máquina “A” hace el 40% de las botellas producidas en una fábrica. La Máquina “B” hace
el resto. La Máquina “A” tiene una pérdida del 5% de su producto, mientras que la pérdida de la
máquina “B” sólo el 2%. Usando un diagrama de árbol apropiado, determinar la probabilidad de
que la próxima botella inspeccionada en esta fábrica se echa a perder.
A veces el proceso de inspección hace que sea imposible devolver el objeto al grupo grande. Por
ejemplo:
Considere la posibilidad de una caja que contiene 3 rojas, 2 azules y 1 canica amarilla. Si
tomamos una muestra de dos canicas, podemos hacer esto o bien:
La rama remarcada representa una canica azul con el primer sorteo y una canica de color rojo
con el segundo sorteo. Escribimos esto como BR.
Considerar que:
EJEMPLO 6. Una bolsa contiene canicas, 5 rojas y 3 azules. Dos canicas se extraen
simultáneamente de la bolsa.
Determinar la probabilidad de que al menos se escoge una de color rojo.
1. Dos canicas se dibujan en la sucesión de una caja que contiene 2 púrpura y 5 canicas verdes.
Determinar la probabilidad de que las dos canicas son de colores diferentes si:
3. Un dado tiene 4 caras con A, y 2 caras con B. Un frasco “A” contiene 3 rojos y 2 boletos
verdes. El frasco “B” contiene 3 rojos y 7 billetes verdes. Un rollo de la matriz se utiliza para
seleccionar ya sea un tarro o frasco B. Una vez que un frasco ha sido seleccionado, dos entradas
se seleccionan al azar sin reemplazo. Determinar la probabilidad de que:
Los diagramas de Venn se pueden utilizar para resolver ciertos tipos de preguntas de
probabilidad y también para establecer un número de las leyes de probabilidad.
Si el evento A es "un número inferior a 3", entonces hay dos resultados que satisfagan evento A.
podemos escribir A = 1,2
2 1
n(U ) = 6 y n( A) = 2 por lo tanto P ( A) = =
6 3
EJEMPLO 7.
SI P( A) = 0.6 P( A B) = 0.7 Y P( A B) = 0.3 HALLAR P(B)
EJEMPLO 9.
En una clase de 25 alumnos, 14 prefieren pizza y 16 café helado. Un estudiante no le gusta ni
uno de los dos y 6 estudiantes les gustan ambos. Un estudiante es seleccionado al azar de la
clase. ¿Cuál es la probabilidad de que el estudiante:
a. Le guste la pizza b. le guste la pizza dado que a él o a ella le guste el café helado?
SI A Y B SON EVENTOS
EJEMPLO 10.
En una clase de 40 estudiantes, a 34 les gustan los plátanos, 22 la piña, y a 2 ambas
frutas. Un estudiante es seleccionado al azar. Encuentre la probabilidad de que el
estudiante:
a. Le guste ambas frutas b. le guste al menos una fruta
c. le guste el plátano dado que a él o a ella le guste la piña
d. no le guste la piña dado que le gusta el plátano.
c. pelo oscuro, pero no marrones ojos d. ojos marrones dado que él tiene el
pelo oscuro.
7. 50 estudiantes fueron caminatas. 23 eran quemados por el sol, 22 eran mordidos por
las hormigas, y 5 eran tanto quemados por el sol y mordidos por las hormigas.
EJEMPLO 14.
2 1 1
Suponga que P ( A) = , P ( B / A) = , Y P ( B / A) = . HALLAR:
5 3 4
a. P( B) b. P( A B)
1.
2.
El controlador de calidad de la fábrica pone a prueba al azar 120 bolígrafos, para revisar cada
una de ellas, para reemplazarlas en el lote antes de la siguiente elección.
VARIABLES ALEATORIAS
En trabajos anteriores sobre la probabilidad hemos descrito los eventos usando palabras. Sin
embargo, si es posible, es mucho más conveniente utilizar números.
Una VARIABLE ALEATORIA representa en número formas en que posibles resultados podrían
ocurrir en algún experimento aleatorio.
Una VARIABLE ALEATORIA DISCRETA X tiene un conjunto de posibles valores distintos. En este
curso se tendrá en cuenta sólo un número finito de resultados, por lo que les etiqueta como
x1 , x2 , x3 , x4 ...xn
Por ejemplo, X podría ser:
Para determinar el valor de una variable aleatoria discreta que tenemos que contar.
Una VARIABLE ALEATORIA CONTINUA X puede tomar los valores posibles en un cierto intervalo
de la recta numérica.
Para determinar el valor de una variable aleatoria continua tenemos que medir.
DISTRIBUCIONES DE PROBABILIDAD
Para cualquier variable aleatoria corresponde distribución de probabilidad, que describe la
probabilidad de que la variable tomará cualquier valor particular.