Bioestadistica Word

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 11

UNIVERSIDAD DE SANTANDER UDES

FACULTAD DE CIENCIAS EXACTAS, NATURALES Y AGROPECUARIAS


DEPARTAMENTO DE MATEMÁTICAS Y FÍSICA
BIOESTADÍSTICA 16172-C

PROYECTO DE AULA

Presentado por:

Cod: 01210281014 Arteaga Gutiérrez Ingrid Fernanda


Cod: 01210281053 Carreño Bueno María Camila
Cod: 01210281046 López Sánchez Daniela
Cod: 01210281058 Osorio Rivera Angella Yaireth

Estudiante Enfermería segundo semestre

Materia:
Bioestadística
16172-C

Jueves 18 de Noviembre de 2021


UNIVERSIDAD DE SANTANDER UDES
FACULTAD DE CIENCIAS EXACTAS, NATURALES Y AGROPECUARIAS
DEPARTAMENTO DE MATEMÁTICAS Y FÍSICA
BIOESTADÍSTICA 16172-C

PROYECTO DE AULA

Presentado por:

Cod: 01210281014 Arteaga Gutiérrez Ingrid Fernanda


Cod: 01210281053 Carreño Bueno María Camila
Cod: 01210281046 López Sánchez Daniela
Cod: 01210281058 Osorio Rivera Angella Yaireth

Estudiantes Enfermería segundo semestre

Presentado a:
MANUELA GONZÁLEZ HURTADO
Docente

Materia:
Bioestadística
16172-C

Jueves 18 de Noviembre de 2021


UNIVERSIDAD DE SANTANDER UDES
FACULTAD DE CIENCIAS EXACTAS, NATURALES Y AGROPECUARIAS
DEPARTAMENTO DE MATEMÁTICAS Y FÍSICA
BIOESTADÍSTICA 16172-C

Introducción:

Los Métodos Estadiś ticos nos ayudan a controlar y mejorar los procesos productivos a través de
una caracteriś tica llamada variabilidad. Todos los procesos tienen variabilidad debido a que
existen muchos factores que nos rodean que no son controlables o incluso desconocidos.

El objetivo de la Estadiś tica Descriptiva es ordenar, analizar y representar un conjunto de datos


relativos a observaciones realizadas en la vida real (altura de las personas, temperatura en
diferentes meses del año, peso de ciertos productos) o como en el caso de nuestra investigación,
variables como la edad, el estado civil o marital y el grado educativo, con el fin de describir las
caracteriś ticas de éstos y extraer conclusiones, que se representarán mediante la tabulación de
graficas de datos como: Tablas, diagramas circulares y de barras, etc.
UNIVERSIDAD DE SANTANDER UDES
FACULTAD DE CIENCIAS EXACTAS, NATURALES Y AGROPECUARIAS
DEPARTAMENTO DE MATEMÁTICAS Y FÍSICA
BIOESTADÍSTICA 16172-C

ANÁLISIS DE RESULTADOS Y DATOS:

1. Descripción de la base de datos:


Los datos están relacionados con campañas de marketing directo de una institución bancaria portuguesa.
Las campañas de marketing se basaron en llamadas telefónicas. A menudo, se requería más de un
contacto con el mismo cliente, para poder acceder si el producto (depósito a plazo bancario) estaría ('sí')
o no ('no') suscrito.

3) bank-full.csv con todos los ejemplos y 17 entradas, ordenadas por fecha (versión anterior de este
conjunto de datos con menos entradas).

2. Tabla resumen de tipos de variables, según la escala de medición:

Nombre variable Tipo Categorías


Edad Cuantitativa discreta
Trabajo Cualitativa nominal "admin.", "unknown",
"unemployed",
"management",
"housemaid",
"entrepreneur", "student",
"blue-collar",
"selfemployed", "retired",
"technician", "services"
Estado civil Cualitativa nominal "married", "divorced",
"single"
Educación Cualitativa ordinal "unknown", "secondary",
"primary", "tertiary"
Crédito incumplimiento Cualitativa nominal "yes", "no"
Saldo medio anual Cuantitativa discreta
Préstamo de vivienda Cualitativa nominal "yes", "no"
Préstamo personal Cualitativa nominal "yes", "no"
Contacto Cualitativa nominal "unknown", "telephone",
"cellular"
Último día contactado Cuantitativa discreta
Último mes de contactado Cualitativa ordinal "jan", "feb", "mar", ...,
"nov", "dec"
Duración último contacto Cuantitativa discreta
Número de contactos Cuantitativa discreta
realizados
Número de días después de Cuantitativa discreta
contactado
Número de contactos antes Cuantitativa discreta -1 means client was not
de campaña previously contacted
Resultado de campaña Cualitativa ordinal "unknown", "other",
UNIVERSIDAD DE SANTANDER UDES
FACULTAD DE CIENCIAS EXACTAS, NATURALES Y AGROPECUARIAS
DEPARTAMENTO DE MATEMÁTICAS Y FÍSICA
BIOESTADÍSTICA 16172-C

"failure", "success"
Suscrito a depósito a plazo Cualitativa nominal "yes", "no"

3. Realice un gráfico de barras:

Diagrama de barras
16000
13766
14000
Cantidad clientes

12000
10000
8000 68956247
6000 5341
3970
4000 2649 2932
1403
2000 477 579 738 214
0
jan feb mar apr may jun jul aug sep oct nov dec
Último mes de contactado

 Del gráfico de barras se puede establecer que la mayoría de las personas fueron contactadas en el
mes de Mayo seguido de los meses Julio, Agosto y Junio.

4. Realice un diagrama circular:

Diagrama circular
divorced
12%

single
28% married
60%

married single divorced

Se puede establecer que el 60% de las personas contactadas durante la campaña del banco están casadas,
el 12% están divorciadas y el restante 28% están solteras.
UNIVERSIDAD DE SANTANDER UDES
FACULTAD DE CIENCIAS EXACTAS, NATURALES Y AGROPECUARIAS
DEPARTAMENTO DE MATEMÁTICAS Y FÍSICA
BIOESTADÍSTICA 16172-C

5. Realice un histograma:

Histograma
18000
16000
Cantidad clientes

14000
12000
10000
8000
6000
4000
2000
0
664.6
132.9
398.8

930.4
1196.3
1462.1
1727.9
1993.8
2259.6
2525.5
2791.3
3057.1
3323.0
3588.8
3854.6
4120.5
4386.3
4652.2
4918.0
Duración de la última vez que fue contactado (seg)

 Se puede establecer que alrededor del 70% de los clientes del banco se han tomado un tiempo
menor a 265.8 segundos la última vez que fueron contactados.

6. Tome una variable y haga una descripción de esta a partir de las medidas de centro y
variabilidad

 Medidas de centro y dispersión para la edad de los clientes del banco

Media 40.93621
Mediana 39
Moda 32
Desviación estándar 10.618762
Varianza de la muestra 112.75811

Se tiene que la edad media con la que cuentan los clientes de aproximadamente 41 años, en donde la
mayoría de ellos tiene una edad de 32 años, con una edad centrada de 39 años. (esto nos indica que,
moda < mediana < media, la edad se encuentra sesgada a la derecha).

Por otra parte, la variabilidad de la misma viene representada por la desviación estándar que es de 10.6
años aproximadamente.
UNIVERSIDAD DE SANTANDER UDES
FACULTAD DE CIENCIAS EXACTAS, NATURALES Y AGROPECUARIAS
DEPARTAMENTO DE MATEMÁTICAS Y FÍSICA
BIOESTADÍSTICA 16172-C

7. Tome una variable y haga una descripción de esta a partir de las medidas de posición

 Medidas de posición de la variable último día del mes que ha sido contactado

Deciles y Cuartiles

P1 5
P2 7
P3 10
P4 13
P5 16
P6 18
P7 20
P8 24
P9 28
P10 31
Q1 8
Q2 16
Q3 21

De esta tabla de datos se puede describir que: el 25% de los clientes fueron contactados durante los
primeros 8 días del mes, el 60% de ellos fueron contactados dentro de los primeros 18 días del mes y el
75% de los mismos, fueron contactados dentro de los 21 días del mes.

8. Aplique el coeficiente de variación:

Coeficiente de variación

Edad Día contactado


Coef Variación 0.2593978 0.5265193

Con estos dos valores de coeficientes de variación para las variables edad y día del mes que fue
contactado se tiene que existe una mayor dispersión en esta última puesto que su valor de CV es el
doble del valor del CV de la edad.

9. Use la regresión Lineal con dos de sus variables (Diagrama de dispersión, coeficiente de
correlación, recta de mejor ajuste, coeficiente de determinación y predicción)
UNIVERSIDAD DE SANTANDER UDES
FACULTAD DE CIENCIAS EXACTAS, NATURALES Y AGROPECUARIAS
DEPARTAMENTO DE MATEMÁTICAS Y FÍSICA
BIOESTADÍSTICA 16172-C

Regresión lineal entre la Edad y el Saldo medio anual

Relación Edad vs Saldo


120000

100000
Saldo medio anual

80000 y = 28.038x + 214.52


R² = 0.0096
60000

40000

20000

0
0 20 40 60 80 100
-20000
Edad

 Coeficiente correlación: 0.09798


 Recta mejor ajuste: Saldo medio = 28.038 * Edad + 214.52
 Coeficiente determinación: 0.0096
 Predicción: como en la base de datos no hay clientes con 91 años, se hará su predicción, Saldo
medio = 28.038(91) + 214.52 = 2765,978, Por tanto, una persona de 91 años tendrá un saldo
medio anual de 2765,978 euros.

10. Realice una tabla de contingencia y determine algunas probabilidades: (conjunta, marginal,
condicional, unión de eventos)

Tabla de contingencia entre Educación y Trabajo del cliente

Trabajo \ Educación primary secondary tertiary unknown Total general


admin. 209 4219 572 171 5171
blue-collar 3758 5371 149 454 9732
entrepreneur 183 542 686 76 1487
housemaid 627 395 173 45 1240
management 294 1121 7801 242 9458
retired 795 984 366 119 2264
self-employed 130 577 833 39 1579
services 345 3457 202 150 4154
student 44 508 223 163 938
UNIVERSIDAD DE SANTANDER UDES
FACULTAD DE CIENCIAS EXACTAS, NATURALES Y AGROPECUARIAS
DEPARTAMENTO DE MATEMÁTICAS Y FÍSICA
BIOESTADÍSTICA 16172-C

technician 158 5229 1968 242 7597


unemployed 257 728 289 29 1303
unknown 51 71 39 127 288
Total general 6851 23202 13301 1857 45211
UNIVERSIDAD DE SANTANDER UDES
FACULTAD DE CIENCIAS EXACTAS, NATURALES Y AGROPECUARIAS
DEPARTAMENTO DE MATEMÁTICAS Y FÍSICA
BIOESTADÍSTICA 16172-C

Conclusiones

1. De las variables estadísticas estudiadas en el presente proyecto se logró establecer que:

 Se puede establecer que alrededor del 70% de los clientes del banco se han tomado un
tiempo menor a 265.8 segundos la última vez que fueron contactados.

 Del gráfico de barras se puede establecer que la mayoría de las personas fueron contactadas
en el mes de Mayo seguido de los meses Julio, Agosto y Junio.

 Se puede establecer que el 60% de las personas contactadas durante la campaña del banco
están casadas, el 12% están divorciadas y el restante 28% están solteras.

 El 25% de los clientes fueron contactados durante los primeros 8 días del mes, el 60% de
ellos fueron contactados dentro de los primeros 18 días del mes y el 75% de los mismos,
fueron contactados dentro de los 21 días del mes.
UNIVERSIDAD DE SANTANDER UDES
FACULTAD DE CIENCIAS EXACTAS, NATURALES Y AGROPECUARIAS
DEPARTAMENTO DE MATEMÁTICAS Y FÍSICA
BIOESTADÍSTICA 16172-C

Bibliografía

Uci Machine Learning Repository . (2007). Obtenido de Center for Machine Learning and Intelligent
Systems: https://archive.ics.uci.edu/ml/index.php

También podría gustarte