Bioestadistica Word
Bioestadistica Word
Bioestadistica Word
PROYECTO DE AULA
Presentado por:
Materia:
Bioestadística
16172-C
PROYECTO DE AULA
Presentado por:
Presentado a:
MANUELA GONZÁLEZ HURTADO
Docente
Materia:
Bioestadística
16172-C
Introducción:
Los Métodos Estadiś ticos nos ayudan a controlar y mejorar los procesos productivos a través de
una caracteriś tica llamada variabilidad. Todos los procesos tienen variabilidad debido a que
existen muchos factores que nos rodean que no son controlables o incluso desconocidos.
3) bank-full.csv con todos los ejemplos y 17 entradas, ordenadas por fecha (versión anterior de este
conjunto de datos con menos entradas).
"failure", "success"
Suscrito a depósito a plazo Cualitativa nominal "yes", "no"
Diagrama de barras
16000
13766
14000
Cantidad clientes
12000
10000
8000 68956247
6000 5341
3970
4000 2649 2932
1403
2000 477 579 738 214
0
jan feb mar apr may jun jul aug sep oct nov dec
Último mes de contactado
Del gráfico de barras se puede establecer que la mayoría de las personas fueron contactadas en el
mes de Mayo seguido de los meses Julio, Agosto y Junio.
Diagrama circular
divorced
12%
single
28% married
60%
Se puede establecer que el 60% de las personas contactadas durante la campaña del banco están casadas,
el 12% están divorciadas y el restante 28% están solteras.
UNIVERSIDAD DE SANTANDER UDES
FACULTAD DE CIENCIAS EXACTAS, NATURALES Y AGROPECUARIAS
DEPARTAMENTO DE MATEMÁTICAS Y FÍSICA
BIOESTADÍSTICA 16172-C
5. Realice un histograma:
Histograma
18000
16000
Cantidad clientes
14000
12000
10000
8000
6000
4000
2000
0
664.6
132.9
398.8
930.4
1196.3
1462.1
1727.9
1993.8
2259.6
2525.5
2791.3
3057.1
3323.0
3588.8
3854.6
4120.5
4386.3
4652.2
4918.0
Duración de la última vez que fue contactado (seg)
Se puede establecer que alrededor del 70% de los clientes del banco se han tomado un tiempo
menor a 265.8 segundos la última vez que fueron contactados.
6. Tome una variable y haga una descripción de esta a partir de las medidas de centro y
variabilidad
Media 40.93621
Mediana 39
Moda 32
Desviación estándar 10.618762
Varianza de la muestra 112.75811
Se tiene que la edad media con la que cuentan los clientes de aproximadamente 41 años, en donde la
mayoría de ellos tiene una edad de 32 años, con una edad centrada de 39 años. (esto nos indica que,
moda < mediana < media, la edad se encuentra sesgada a la derecha).
Por otra parte, la variabilidad de la misma viene representada por la desviación estándar que es de 10.6
años aproximadamente.
UNIVERSIDAD DE SANTANDER UDES
FACULTAD DE CIENCIAS EXACTAS, NATURALES Y AGROPECUARIAS
DEPARTAMENTO DE MATEMÁTICAS Y FÍSICA
BIOESTADÍSTICA 16172-C
7. Tome una variable y haga una descripción de esta a partir de las medidas de posición
Medidas de posición de la variable último día del mes que ha sido contactado
Deciles y Cuartiles
P1 5
P2 7
P3 10
P4 13
P5 16
P6 18
P7 20
P8 24
P9 28
P10 31
Q1 8
Q2 16
Q3 21
De esta tabla de datos se puede describir que: el 25% de los clientes fueron contactados durante los
primeros 8 días del mes, el 60% de ellos fueron contactados dentro de los primeros 18 días del mes y el
75% de los mismos, fueron contactados dentro de los 21 días del mes.
Coeficiente de variación
Con estos dos valores de coeficientes de variación para las variables edad y día del mes que fue
contactado se tiene que existe una mayor dispersión en esta última puesto que su valor de CV es el
doble del valor del CV de la edad.
9. Use la regresión Lineal con dos de sus variables (Diagrama de dispersión, coeficiente de
correlación, recta de mejor ajuste, coeficiente de determinación y predicción)
UNIVERSIDAD DE SANTANDER UDES
FACULTAD DE CIENCIAS EXACTAS, NATURALES Y AGROPECUARIAS
DEPARTAMENTO DE MATEMÁTICAS Y FÍSICA
BIOESTADÍSTICA 16172-C
100000
Saldo medio anual
40000
20000
0
0 20 40 60 80 100
-20000
Edad
10. Realice una tabla de contingencia y determine algunas probabilidades: (conjunta, marginal,
condicional, unión de eventos)
Conclusiones
Se puede establecer que alrededor del 70% de los clientes del banco se han tomado un
tiempo menor a 265.8 segundos la última vez que fueron contactados.
Del gráfico de barras se puede establecer que la mayoría de las personas fueron contactadas
en el mes de Mayo seguido de los meses Julio, Agosto y Junio.
Se puede establecer que el 60% de las personas contactadas durante la campaña del banco
están casadas, el 12% están divorciadas y el restante 28% están solteras.
El 25% de los clientes fueron contactados durante los primeros 8 días del mes, el 60% de
ellos fueron contactados dentro de los primeros 18 días del mes y el 75% de los mismos,
fueron contactados dentro de los 21 días del mes.
UNIVERSIDAD DE SANTANDER UDES
FACULTAD DE CIENCIAS EXACTAS, NATURALES Y AGROPECUARIAS
DEPARTAMENTO DE MATEMÁTICAS Y FÍSICA
BIOESTADÍSTICA 16172-C
Bibliografía
Uci Machine Learning Repository . (2007). Obtenido de Center for Machine Learning and Intelligent
Systems: https://archive.ics.uci.edu/ml/index.php