VF Tda203 Apunte Semana 5

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 21

Unidad 2

Probabilidad y Estadística inferencial para la


ciencia de datos
ESCUELA DE NEGOCIOS

Directora: Lorena Patricia Baus

ELABORACIÓN

Experta disciplinar: Marisol López Núñez

Diseñadora instruccional: Luisa García Ospina

Editora instruccional: Trinidad Marshall

VALIDACIÓN

Experto disciplinar: Diego Amenábar

Jefa de Diseño Instruccional: Alejandra San Juan Reyes

EQUIPO DE DESARROLLO

Welearn

AÑO

2022
Tabla de contenidos
Aprendizaje esperado .............................................................................................. 4

Introducción .............................................................................................................. 5

1. Cálculo de probabilidades: casos esperados/casos posibles ........................ 6

2. Probabilidad teórica y probabilidad experimental .......................................... 8

2.1 Términos importantes de probabilidad ............................................................. 10

2.1.1. Espacio Muestral (E) ............................................................................... 10

2.1.2. Evento o suceso ...................................................................................... 10

3. Probabilidad dependiente e independiente .................................................. 12

4. Probabilidad con y sin repetición ..................................................................... 13

5. Probabilidad bayesiana ..................................................................................... 16

Cierre ........................................................................................................................ 19

Referencias bibliográficas ...................................................................................... 21


Aprendizaje esperado
Aplican cálculo de probabilidades, mediante funciones de un lenguaje de
programación, considerando el uso de la probabilidad bayesiana, en casos
empresariales.

Fuente: Trygve Finkelsen en Shutterstock (s.f)


Introducción
¿Cuál es la utilidad de las probabilidades para la ciencia de datos en nuestra
vida diaria y profesional?

El uso de las probabilidades para la ciencia de datos es relevante en la vida


cotidiana, debido a que con ellas acordar con exactitud los sucesos
inestimables y que corresponden al azar en diferentes rubros tanto en la
ciencia como en nuestro día a día. Además, permite a las organizaciones estar
al tanto de todos los resultados posibles, de éxito o fracaso, frente a la
elaboración de nuevos proyectos.

Comprender las probabilidades en sí mismas y como ciencia constituye un


aumento en el grado de satisfacción y significancia en un estudio estadístico.
El procesamiento de datos probabilísticos suministra las normas para la
realización de experimentos aleatorios, que componen la base para la
estadística inferencial.

En resumen, se puede definir la probabilidad como un procedimiento donde


se obtiene la frecuencia de un suceso explícito a través de la ejecución de un
experimento aleatorio, donde se podrán conocer todos los posibles resultados.
Las probabilidades de estos sucesos siempre serán mayor o igual a cero, así
como la probabilidad de un suceso seguro siempre será igual a uno.

5
1. Cálculo de probabilidades: casos
esperados/casos posibles
Para identificar la aplicación del cálculo de probabilidades en la resolución de
problemas profesionales y cotidianos, es necesario saber que corresponden al
estudio de determinados experimentos conocidos como “aleatorios” o
“productos del azar”, algunos ejemplos comúnmente conocidos en nuestra
vida diaria son:

• El lanzamiento de una moneda.

• El lanzamiento de un dado.

• Extracción de una carta de un mazo de naipes.

El método básico para calcular probabilidades es de acuerdo con los casos


favorables o posibles y casos totales, es decir:

• Probabilidad P(xi) = Número de casos favorables/Número total de


casos posibles.

• Probabilidad: 2/10= 1/5= 0,2= 20%

Ejemplo:

1. En una distribuidora de artículos electrodomésticos se disponen de 12


microondas de la marca A, 8 microondas de la marca B y 9 de la marca
C. ¿Cuál es la probabilidad simple de sacar un microondas al azar de la
marca “A”’? Probabilidad P(A): 12/29= 0,41= 41%

6
2. En una caja hay 87 sobres de carta y 68 son azules. Si se escoge uno,
¿cuál es la probabilidad de que esta sea azul? Probabilidad P(A): 68/87=
0,78= 78%

7
2. Probabilidad teórica y probabilidad
experimental
Al relacionar este tipo de enfoque probabilístico para usarlo en distintos casos
de uso y en función de un tipo de problema empresarial se debe tener
presente la parte teórica y la parte experimental de las probabilidades.

Para poder entender estos conceptos, vamos a suponer que se disponen en


una bolsa papeles escritos con números del cero al nueve. La bolsa se revuelve
y en seguida se elige un trozo de papel al azar, con este experimento surge la
pregunta ¿cuál es la probabilidad teórica de que sea un número par?

Si se vuelve a realizar el experimento quince veces, y se eligiera un número par


ocho veces, entonces, nuevamente nos preguntamos, ¿cuál es la
probabilidad experimental de elegir un número par? La diferencia en ambas
preguntas son los términos probabilidad teórica y experimental.

Las probabilidades usan fórmulas para establecer la probabilidad porcentual


de que suceda un evento, pero siempre se comienza a través de un
experimento, que debe ser controlado.

Un ejemplo siempre utilizado y conocido es el de lanzamiento de una moneda


para saber la probabilidad de que sea sello. Al realizar el experimento, se debe
controlar a través de una tabla donde se anotarán las veces que sale cara y
sello, es decir, se registrará el resultado, y esto es conocido como una
simulación de probabilidad. Por lo tanto, la probabilidad teórica se describe
como una proporción que formula las veces de tener éxito en los eventos
totales de un experimento.

8
Es decir, esto se puede descifrar brevemente como:

P (obtener un cinco) =1/6 ≈16.67%

Las probabilidades se formulan de tres formas:

• Como una fracción.

• Como un porcentaje.

• Como un decimal.

Por otra parte, la probabilidad experimental se refiere a la probabilidad


establecida en un suceso a través del cálculo de su frecuencia relativa
cuando se repite el experimento reiteradas veces. Entre más veces o mayor
sea el número de pruebas realizadas, más se acerca el valor obtenido al valor
anónimo de la probabilidad teórica.

Ejemplo:

• Cuando se lleva a cabo el experimento para saber la probabilidad si


sale sello, se debe lanzar la moneda para poder saber el resultado y esta
acción es la que se denomina probabilidad experimental. Para saber la
probabilidad que al lanzar un dado salga un número par, se debe
realizar el experimento y lanzar el dado según la cantidad de veces que
se quiera hacer el experimento para obtener el resultado.

• Si se necesita saber el premio que se puede ganar una persona al


concursar en la ruleta millonaria se debe girar la ruleta etc.

9
• Para calcular la probabilidad experimental de que al lanzar un dado
salga 3, tendrías que llevar a cabo un experimento para saber los
resultados.

2.1 Términos importantes de probabilidad

2.1.1. Espacio Muestral (E)

El espacio muestral es el conjunto de todos los posibles resultados de un


experimento aleatorio.

Por ejemplo:

• El espacio muestral al lanzar una moneda es {cara, cruz}.

• El espacio muestral al tirar un dado es S= {1,2,3,4,5,6,}.

• El espacio muestral al lanzar dos monedas es E = {(c,c), (c,s), (s,c), (s,s)}.

• El espacio muestral al lanzar tres monedas es E = {(c,c,c), (c,c,s), (c,s,c),


(c,s,s), (s,c,c), (s,c,s), (s,s,c), (s,s,s)}.

2.1.2. Evento o suceso

Para obtener o calcular un evento se debe tener definido el número de


objetos que componen el espacio muestral. De esta manera, se puede
calcular la probabilidad de un evento específico, y así cualquier resultado
posible del experimento es llamado evento, es decir, es cualquier subconjunto
del espacio muestral.

10
Ejemplo:

En el lanzamiento de un dado se tiene el siguiente espacio muestral:

E = {1, 2, 3, 4, 5, 6}

Dado el espacio muestral los siguientes son eventos:

• Obtener un número primo: A = {2, 3, 5}.

• Obtener un número primo y par: B = {2}.

• Obtener un número mayor o igual a 5: C = {5, 6}.

11
3. Probabilidad dependiente e
independiente
Para calcular probabilidades dependientes e independientes, con y sin
repetición, se debe comprender que es necesario realizar observaciones de
varios eventos donde puede que uno dependa del otro.

Por ejemplo, se tienen los siguientes sucesos o eventos:

• A= "El día está gris" y B="llevar paraguas", ambos intervienen entre sí.

• C= “El suceso estudiar” y D= “El suceso aprobar”, son sucesos que se


benefician; es decir, cuando se estudia aumenta la probabilidad de
aprobar.

La probabilidad de que ocurra un suceso B cuando está ocurriendo otro, A, se


llama condicionada, lo cual se expresa como P(B/A), y se calcula de la
siguiente forma:

P(B/A) =P(A∩B) /P(A)

Dos sucesos son independientes cuando la presencia del uno no influye en la


probabilidad del otro, es decir, si P(B/A) =P(B); en caso contrario, son
dependientes.

A y B independientes (B/A) =P(B) al tener en cuenta la fórmula anterior para


P(B/A), luego se tiene que P(A∩B) =P(A)·P(B).

12
4. Probabilidad con y sin repetición
Para calcular probabilidades dependientes e independientes, con y sin
repetición, se usa la combinatoria con y sin repetición en los distintos
conjuntos que se pueden crear con cierta cantidad de elementos, escogidos
de uno en uno. Cada conjunto debe tener al menos un elemento distinto al
conjunto anterior, en este caso no importa el orden, y estos no se pueden
repetir.

La combinatoria sin repetición concuerda con muchas situaciones de la vida


real y su aplicación es bastante sencilla. Por ejemplo, un caso común es el de
un examen de cuatro preguntas, donde, de las cuatro debes elegir tres.

¿Cuántas combinaciones distintas se podrían realizar en el examen?

Se podría elegir cómo contestar a las 3 preguntas de cuatro formas distintas,


es decir:

• Opción 1: Responder las preguntas 1,2,3.

• Opción 2: Responder las preguntas 1,2,4.

• Opción 3: Responder las preguntas 1,3,4.

• Opción 4: Responder las preguntas 2,3,4.

Se pueden crear cuatro conjuntos (n) con tres elementos (x).

Se puede concluir que la combinatoria sin repetición indica cómo se pueden


agrupar una cantidad de observaciones finitas en grupos de una cantidad
establecida sin que ninguno de los elementos se repita en cada grupo. Acá es

13
donde se define la primordial diferencia entre la combinatoria con repetición
(se pueden repetir los elementos en cada grupo) y la combinatoria sin
repetición (no se puede repetir ningún elemento en cada grupo).

Para calcular la combinatoria sin repetición se debe tener la siguiente fórmula:

Donde:

• n = observaciones totales.

• x = número de elementos seleccionados.

Un ejemplo de combinatoria sin repetición es, por ejemplo:

Se tiene un grupo de doce estudiantes, y el profesor jefe quiere crear grupos


de dos estudiantes para que realicen una actividad de la clase. ¿Cuántos
grupos distintos podría formar?

Respuesta:

Para desarrollar el ejemplo, primero se debe identificar el número total de


elementos. En este caso son 12 estudiantes en total, por tanto, ya se tiene el n
(tamaño de la muestra). Como el profesor quiere grupos de 2, ya se sabe cuál
es nuestra x. Sabiendo esto, podríamos sustituir en la fórmula y tener el número
de combinaciones de grupos de 2.

• n = 12

• x=2

14
Al sustituir:

12 12!
( )=
2 2! (12 − 2)!

Por tanto, el número combinatorio es:

479.001.600
= 66
7.257.600

Entonces, el profesor puede formar sesenta y seis parejas distintas de


estudiantes entre los 12 que dispone.

15
5. Probabilidad bayesiana
El uso aplicado del cálculo de probabilidad bayesiana de acuerdo con su
utilidad, en la resolución de problemas profesionales y cotidianos, se conoce
como Teorema de Bayes, que consiste en conocer las probabilidades de que
ocurran una serie de sucesos Ai, pero además se le debe sumar otro suceso B,
cuya ocurrencia suministra cierta información, porque las probabilidades de
ocurrencia de B son distintas según el suceso Ai que haya ocurrido.

“La teoría de la decisión Bayesiana plantea que la tarea de predecir la clase


a la que pertenece un elemento se puede tratar en términos probabilísticos”
(Duda, 2001).

Además de calcular probabilidad total, a partir los diferentes sucesos, se


calcula la probabilidad de que sea defectuoso.

El teorema de Bayes es muy ventajoso, ya que empleándolo de la manera


correcta se puede conocer la probabilidad de que un suceso A ocurra,
teniendo presente lo ocurrido durante el evento B. Asimismo, existe la
probabilidad de que suceda lo contrario, donde ocurra B dado A.

16
Figura 1: Definición de Teorema de Bayes.
Fuente: Adaptado de Gascó, T. (2019, enero 23)

Ejemplo:

El 20% de los empleados de una empresa son ingenieros y otro 20% son
economistas. El 75% de los ingenieros ocupan un puesto directivo y el 50% de
los economistas también, mientras que los no ingenieros y los no economistas
solamente el 20% ocupa un puesto directivo. ¿Cuál es la probabilidad de que
un empleado directivo elegido al azar sea ingeniero?

17
Respuesta: la probabilidad de que un empleado directivo elegido al azar sea
ingeniero es de 0,405.

18
Cierre

19
El organizador gráfico entrega una síntesis de los métodos de análisis en el
proceso de las probabilidades, la figura simboliza los distintos tipo de
probabilidades de la información que se analiza.

20
Referencias bibliográficas
• Gascó, T. (23 de enero de 2019). Definición de Teorema de Bayes.
Economiasimple.net. Obtenido de https://bit.ly/3UsHHmC

• Idaejin.github.io. (s.f). 5 Distribuciones de probabilidad en R.


Idaejin.github.io. Obtenido de https://bit.ly/3U6X0BX

• Kross, S. (1 de octubre de 2015). Introduction to dnorm, pnorm, qnorm,


and rnorm for new biostatisticians. Seankross.com. Obtenido de
https://bit.ly/3hh1WWo

• Lind, D., Marchal, W., y Wathen, S. (2012). Estadística Aplicada a los


Negocios y a la Economía (15 Edición). McGraw-Hill Interamericana
Editores, S.A de C.V.

21

También podría gustarte