0% encontró este documento útil (0 votos)

80 vistas5 páginas

Programación Lineal en Python

Este documento resume los pasos para realizar un modelo de regresión lineal en Python utilizando los paquetes Scikit-Learn, Pandas y Matplotlib. Primero se cargan los datos y se seleccionan las variables explicativa (PIB per cápita) y explicada (esperanza de vida). Luego se crea e implementa un modelo de regresión lineal y se grafican los resultados, incluyendo la recta predicha por el modelo. Finalmente, se calcula el coeficiente de determinación R2, el cual indica que este modelo lineal solo explica el 34% de la

Cargado por

emi

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como PDF, TXT o lee en línea desde Scribd

0% encontró este documento útil (0 votos)

80 vistas5 páginas

Programación Lineal en Python

Cargado por

emi

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como PDF, TXT o lee en línea desde Scribd

Está en la página 1/ 5

Programación Lineal en python

June 12, 2022

Regresión lineal en python

Lo primero que haremos sera cargar los paquetes necesarios para realizar la regresión lineal
• pandas
nos ayudara a manejar la base de datos, leer y administrar los archivos tipo excel,csv,da etc.
• matplotlib.pyplot
nos ayudara a realizar los graficos, siendo parecido a ggplot en R.
• os
nos ayudara a desplazarnos entre directorios de nuestro computador.
• sklearn
de aqui importaremos el paquete LinearRegression con el que realizaremos nuestro modelo de
regresión lineal.
• warnings
Este paquete puede ser omitido, solo lo utilizo para mostrar un resultado mas limpio en el archivo
final.
[4]: ### importar paquetes para trabajar
import pandas as pd
import matplotlib.pyplot as mlp
import os

### importar el paquete para regresión lineal

from sklearn.linear_model import LinearRegression

## ignorar las advertencias

import warnings
warnings.filterwarnings('ignore')
warnings.simplefilter('ignore')

acontinuación nos dirigimos a la carpeta donde se encuentra nuestra base de datos; como se puede
ver en el codigo le di una dirección absoluta, un truco para hacer esto es comenzar con un “/”
jupyter lab nos ayudara autocompletando la dirección de las carpetas.

1
una vez estemos dentro de ese directorio guardamos la base de datos que queremos utilizar, en este
caso mi base de datos se llama “mundo.csv”, la guardamos dentro de la variable datos, y vemos las
primeras 10 observaciones
podemos ver que todas las columnas representan una variable:
• country: representa el pais
• year: año de la observación
• population: población del pais
• continent: continente del pais
• life_exp: expectativa de vida
• gdp_cap: pib per capita
[5]: ## ingresamos a la carpeta de trabajo que contiene nuestra base de datos
os.chdir("/home/lastra/Escritorio/programacion/lenguajes/python/ciencia de␣
↪datos/")

[6]: datos = pd.read_csv("mundo.csv") ## cargamos la base de datos

datos.head(10) ## primeras 10 observaciones

[6]: country year population continent life_exp gdp_cap

0 Afghanistan 1952 8425333 Asia 28.801 779.445314
1 Afghanistan 1957 9240934 Asia 30.332 820.853030
2 Afghanistan 1962 10267083 Asia 31.997 853.100710
3 Afghanistan 1967 11537966 Asia 34.020 836.197138
4 Afghanistan 1972 13079460 Asia 36.088 739.981106
5 Afghanistan 1977 14880372 Asia 38.438 786.113360
6 Afghanistan 1982 12881816 Asia 39.854 978.011439
7 Afghanistan 1987 13867957 Asia 40.822 852.395945
8 Afghanistan 1992 16317921 Asia 41.674 649.341395
9 Afghanistan 1997 22227415 Asia 41.763 635.341351

una vez tenemos hemos cargados esos datos, procedamos a analizar la correlación de variables
numericas con un grafico de disperción entre las variables “gpd_cap” y “life_exp”; no parece
existir una relación directa como se ve en el grafico siguiente:
[7]: mlp.scatter(datos["gdp_cap"], datos["life_exp"], s= 50, c="red")
mlp.title("Pib per capita vs esperanza de vida")
mlp.xlabel("Pib per capita")
mlp.grid()
mlp.ylabel("Esperanza de vida")

[7]: Text(0, 0.5, 'Esperanza de vida')

2
Seleccionamos la variable explicada y explicativa Nuestra variable explicada sera “life_exp” y esta
estara explicada por la variable independiente “gdp_cap”
recordemos que: * life_exp esperanza de vida * gdp_cap pib per capita
luego en la variable modelo guardamos el modelo que usaremos es decir LinearRegression, luego lo
aplicamos con el metodo fit; el parametro “X” guardara nuestra variable explicativa y el parametro
“y” contendra nuestra variable explicada.
luego vemos los resultados del modelo con el metodo __ dict __
[8]: explicativa = datos[["gdp_cap"]] # v. independiente
explicada = datos[["life_exp"]] # v. dependiente

modelo = LinearRegression()

modelo.fit(X= explicativa, y = explicada) ## corremos el modelo

modelo.dict ## vemos los resultados del modelo

[8]: {'fit_intercept': True,

'normalize': 'deprecated',
'copy_X': True,
'n_jobs': None,
'positive': False,

3
'feature_names_in_': array(['gdp_cap'], dtype=object),
'n_features_in_': 1,
'coef_': array([[0.00076488]]),
'rank_': 1,
'singular_': array([406791.72229685]),
'intercept_': array([53.95556088])}

De toda la información que nos muestra el modelo; las dos partes que mas nos interesan son:
• intercept nos muestra el valor que toma la regresión cuando las variables independientes son
iguales a 0
• coef nos muestra el valor que toman los multiplicadores de las variables independientes
entonces la regresión de nuestro modelo se puede expresar de la siguiente manera :

𝑦 = 53.95 + 0.0007 ⋅ 𝑋

entonces aplicamos el modelo con el metodo predict, y se lo aplicamos a valores de X, es decir

nuestra variable explicativa que es “gdp_cap” esto nos devolvera una matriz de valores que son
resultado de aplicar la regresión, y dicha matriz la incluimos en el dataframe con el nombre de
prediccion, con el metodo insert y vemos los primeros 10 datos.
[9]: prediccion = modelo.predict(X = datos[["gdp_cap"]])

## añadimos la prediccion a la base de datos

datos.insert(0, "prediccion", prediccion)

datos.head(10)

[9]: prediccion country year population continent life_exp gdp_cap

0 54.551745 Afghanistan 1952 8425333 Asia 28.801 779.445314
1 54.583417 Afghanistan 1957 9240934 Asia 30.332 820.853030
2 54.608083 Afghanistan 1962 10267083 Asia 31.997 853.100710
3 54.595154 Afghanistan 1967 11537966 Asia 34.020 836.197138
4 54.521560 Afghanistan 1972 13079460 Asia 36.088 739.981106
5 54.556845 Afghanistan 1977 14880372 Asia 38.438 786.113360
6 54.703625 Afghanistan 1982 12881816 Asia 39.854 978.011439
7 54.607544 Afghanistan 1987 13867957 Asia 40.822 852.395945
8 54.452231 Afghanistan 1992 16317921 Asia 41.674 649.341395
9 54.441522 Afghanistan 1997 22227415 Asia 41.763 635.341351

acto seguido, volvemos a realizar el grafico de disperción y incluimos una recta de color rojo con
los valores predichos por el modelo.
[10]: mlp.scatter(datos["gdp_cap"], datos["life_exp"], s= 50, c="blue")
mlp.plot(datos["gdp_cap"], datos["prediccion"], "r--", c="red")
mlp.title("Pib per capita vs esperanza de vida")

4
mlp.xlabel("Pib per capita")
mlp.grid()
mlp.ylabel("Esperanza de vida")

[10]: Text(0, 0.5, 'Esperanza de vida')

medimos que tanto predice nuestro modelo con la bonda de ajuste o el R cuadrado.
[82]: modelo.score(X=explicativa, y=explicada)

[82]: 0.34071295111023236

este modelo unicamente explica el 34% de la variación real de los datos, es decir una regresión lineal
no seria muy util para explicar el valor de la esperanza de vida.

También podría gustarte

Ticketmaster Member Services - Order History
Aún no hay calificaciones
Ticketmaster Member Services - Order History
1 página
Fmsa315 - s11 - A.ipynb - Fernández - Constanza
Aún no hay calificaciones
Fmsa315 - s11 - A.ipynb - Fernández - Constanza
6 páginas
Flanges
0% (1)
Flanges
24 páginas
Las Herramientas Más Eficientes para Optimizar La Gestión de RR
Aún no hay calificaciones
Las Herramientas Más Eficientes para Optimizar La Gestión de RR
22 páginas
Regresion Lineal Alfonso Castro
Aún no hay calificaciones
Regresion Lineal Alfonso Castro
213 páginas
Lista y Despiece Nike
Aún no hay calificaciones
Lista y Despiece Nike
8 páginas
57 - en La Rodada (En Cuesta Abajo. Los Nuevos Pobres Efectos de La Crisis en La Sociedad Argentina) - MINUJIN, Alberto PDF
100% (1)
57 - en La Rodada (En Cuesta Abajo. Los Nuevos Pobres Efectos de La Crisis en La Sociedad Argentina) - MINUJIN, Alberto PDF
10 páginas
Comisión Federal de Electricidad: Bancos de Capacitores para Redes de Disribución
Aún no hay calificaciones
Comisión Federal de Electricidad: Bancos de Capacitores para Redes de Disribución
10 páginas
008 - Miguez, Daniel - El Protestantismo Popular en La Argentina...
Aún no hay calificaciones
008 - Miguez, Daniel - El Protestantismo Popular en La Argentina...
37 páginas
Medicamentosargentina PDF
Aún no hay calificaciones
Medicamentosargentina PDF
70 páginas
Continuación Regresión Lineal Simple
Aún no hay calificaciones
Continuación Regresión Lineal Simple
42 páginas
01.18.05. Reservorio de Cºaº de V 560M3
Aún no hay calificaciones
01.18.05. Reservorio de Cºaº de V 560M3
17 páginas
58050-Texto Del Artículo-118181-3-10-20180528
Aún no hay calificaciones
58050-Texto Del Artículo-118181-3-10-20180528
13 páginas
Base
Aún no hay calificaciones
Base
37 páginas
Semana 12,1
Aún no hay calificaciones
Semana 12,1
4 páginas
Ejemplo de Solicitud de Empleo
0% (1)
Ejemplo de Solicitud de Empleo
1 página
Regresion Lineal
Aún no hay calificaciones
Regresion Lineal
38 páginas
Tidyverse: R Packages For Data Science: Ejercicios 1. Manipulación de Datos en R (Dplyr)
Aún no hay calificaciones
Tidyverse: R Packages For Data Science: Ejercicios 1. Manipulación de Datos en R (Dplyr)
13 páginas
Listoimprimir PDF
Aún no hay calificaciones
Listoimprimir PDF
148 páginas
Bosquejo de Un Informe
Aún no hay calificaciones
Bosquejo de Un Informe
6 páginas
RBenRegBeneficiario Rojas Sigep
Aún no hay calificaciones
RBenRegBeneficiario Rojas Sigep
1 página
Regresion Logistica
Aún no hay calificaciones
Regresion Logistica
40 páginas
Modelos Lineales en R v2 PDF
Aún no hay calificaciones
Modelos Lineales en R v2 PDF
18 páginas
Guia 4 - Matemáticas para Las Ciencias Económicas
Aún no hay calificaciones
Guia 4 - Matemáticas para Las Ciencias Económicas
16 páginas
GMLDiapo 01
Aún no hay calificaciones
GMLDiapo 01
50 páginas
Regresión Lineal Simple
Aún no hay calificaciones
Regresión Lineal Simple
15 páginas
05 Regresión Lineal
Aún no hay calificaciones
05 Regresión Lineal
12 páginas
Examen Unidad 1 Balanced Scorecard
100% (2)
Examen Unidad 1 Balanced Scorecard
8 páginas
General
Aún no hay calificaciones
General
10 páginas
Taller3 Caicedo Ortiz V2
Aún no hay calificaciones
Taller3 Caicedo Ortiz V2
20 páginas
Lab 04 Autotransformadores
Aún no hay calificaciones
Lab 04 Autotransformadores
12 páginas
Dirección Distrital 10D03 Cotacachi - Salud: Memorando Nro. MSP-CZ1-10D03-2020-1768-M Cotacachi, 05 de Junio de 2020
Aún no hay calificaciones
Dirección Distrital 10D03 Cotacachi - Salud: Memorando Nro. MSP-CZ1-10D03-2020-1768-M Cotacachi, 05 de Junio de 2020
3 páginas
Sesion3 RegresionLineal
Aún no hay calificaciones
Sesion3 RegresionLineal
28 páginas
2-Modelos Lineales PDF
Aún no hay calificaciones
2-Modelos Lineales PDF
36 páginas
Guia Introduccion A La Informatica
Aún no hay calificaciones
Guia Introduccion A La Informatica
4 páginas
Incidencia Del Ingreso Familiar y La Educaci On en El Acceso A La Canasta B Asica Familiar en Ecuador
Aún no hay calificaciones
Incidencia Del Ingreso Familiar y La Educaci On en El Acceso A La Canasta B Asica Familiar en Ecuador
13 páginas
Qué Es Un Cuadro Sinóptico
Aún no hay calificaciones
Qué Es Un Cuadro Sinóptico
2 páginas
Ponlo en Practica M2 AMLP
Aún no hay calificaciones
Ponlo en Practica M2 AMLP
3 páginas
01 MUESTREOS Y DISEÑOS Parte 1
Aún no hay calificaciones
01 MUESTREOS Y DISEÑOS Parte 1
32 páginas
Inteligencia Artificial Con Python
Aún no hay calificaciones
Inteligencia Artificial Con Python
6 páginas
Capdevielle 2014
Aún no hay calificaciones
Capdevielle 2014
24 páginas
Computación Avanzada
Aún no hay calificaciones
Computación Avanzada
2 páginas
TP2 Regresion Lineal Multiple
Aún no hay calificaciones
TP2 Regresion Lineal Multiple
38 páginas
Intersecciones en Antropología 1666-2105: Issn: Intersec@soc - Unicen.edu - Ar
Aún no hay calificaciones
Intersecciones en Antropología 1666-2105: Issn: Intersec@soc - Unicen.edu - Ar
18 páginas
Ekelund y Hébert - Historia de La Teoría Económica y de Su Método
Aún no hay calificaciones
Ekelund y Hébert - Historia de La Teoría Económica y de Su Método
17 páginas
R Econometria
Aún no hay calificaciones
R Econometria
5 páginas
CASO PRACTICO 3 - Empresa NexTech
100% (1)
CASO PRACTICO 3 - Empresa NexTech
6 páginas
Asignacion N°2 Final
Aún no hay calificaciones
Asignacion N°2 Final
10 páginas
Diseño e Implementación de Un Osciloscopio Digital de Un Canal Utilizando Tecnología de Sistemas Embebidos Soc Esp32
Aún no hay calificaciones
Diseño e Implementación de Un Osciloscopio Digital de Un Canal Utilizando Tecnología de Sistemas Embebidos Soc Esp32
59 páginas
Desafios de Un Desarrollo Humano Individ
Aún no hay calificaciones
Desafios de Un Desarrollo Humano Individ
19 páginas
Supuestos Modelo Regresion Lineal
Aún no hay calificaciones
Supuestos Modelo Regresion Lineal
27 páginas
Resolución de Examen
Aún no hay calificaciones
Resolución de Examen
3 páginas
Análisis Multivariante PARA SOCIOLOGOS MEDIANTE SPSS (Pag 18) PDF
Aún no hay calificaciones
Análisis Multivariante PARA SOCIOLOGOS MEDIANTE SPSS (Pag 18) PDF
18 páginas
Econometria II - Laboratorio 3
Aún no hay calificaciones
Econometria II - Laboratorio 3
8 páginas
Guía de Referencia de Librerías y Funciones de Análisis Estadístico
Aún no hay calificaciones
Guía de Referencia de Librerías y Funciones de Análisis Estadístico
1 página
Regresion Lineal
Aún no hay calificaciones
Regresion Lineal
8 páginas
Aprendisaje Supervisado
Aún no hay calificaciones
Aprendisaje Supervisado
12 páginas
Algoritmos de Regresión
0% (1)
Algoritmos de Regresión
16 páginas
Tarea 3 Lineal
Aún no hay calificaciones
Tarea 3 Lineal
3 páginas
Introducción Al Análisis de Regresión Lineal Simple en Python
Aún no hay calificaciones
Introducción Al Análisis de Regresión Lineal Simple en Python
9 páginas
Datasheet Bomba Roper 0376 - Motor 5823
Aún no hay calificaciones
Datasheet Bomba Roper 0376 - Motor 5823
4 páginas
Regresión Lineal
Aún no hay calificaciones
Regresión Lineal
8 páginas
Dados
Aún no hay calificaciones
Dados
3 páginas
Regresión Lineal Simple
Aún no hay calificaciones
Regresión Lineal Simple
4 páginas
Regresión Lineal Simple Con R
Aún no hay calificaciones
Regresión Lineal Simple Con R
5 páginas
ALERTA G.DENVER Spsa99-34
Aún no hay calificaciones
ALERTA G.DENVER Spsa99-34
2 páginas
Regresion Lineal y Logica
Aún no hay calificaciones
Regresion Lineal y Logica
6 páginas
Ejercicios Semana 9
Aún no hay calificaciones
Ejercicios Semana 9
8 páginas
Script
Aún no hay calificaciones
Script
4 páginas
Tarea 4
Aún no hay calificaciones
Tarea 4
4 páginas
Gestion de Procesos de Negocios (BMP) Y La Tecnología de La Información
Aún no hay calificaciones
Gestion de Procesos de Negocios (BMP) Y La Tecnología de La Información
25 páginas
Regresion Lineal - 2024
Aún no hay calificaciones
Regresion Lineal - 2024
32 páginas
Torre Tesla
Aún no hay calificaciones
Torre Tesla
9 páginas
Actividad de Aprendizaje Topicos#3
Aún no hay calificaciones
Actividad de Aprendizaje Topicos#3
8 páginas
Guión - Video de Python
Aún no hay calificaciones
Guión - Video de Python
6 páginas
Introducción y Primeros Pasos en Python
Aún no hay calificaciones
Introducción y Primeros Pasos en Python
22 páginas
Estándares Orientados para Egresados de Las Carreras de Pedagogía en Matematica
Aún no hay calificaciones
Estándares Orientados para Egresados de Las Carreras de Pedagogía en Matematica
10 páginas
TP N1 - Enrique Rioja - Leg 407660
Aún no hay calificaciones
TP N1 - Enrique Rioja - Leg 407660
8 páginas
1 TP1 - Poblaciones
Aún no hay calificaciones
1 TP1 - Poblaciones
4 páginas
ISIS1105 202420 Tarea6
Aún no hay calificaciones
ISIS1105 202420 Tarea6
2 páginas
Regresion Lineal Multiple - Sklearn
Aún no hay calificaciones
Regresion Lineal Multiple - Sklearn
4 páginas
Aca 3 Machine Learning
Aún no hay calificaciones
Aca 3 Machine Learning
30 páginas
Fundamentos de Estadística para El Análisis de Datos
Aún no hay calificaciones
Fundamentos de Estadística para El Análisis de Datos
13 páginas
Regresion Lineal Simple - Sklearn
Aún no hay calificaciones
Regresion Lineal Simple - Sklearn
4 páginas
Leccin-1 Modelosderegresion
Aún no hay calificaciones
Leccin-1 Modelosderegresion
44 páginas
Algebra Tarea
Aún no hay calificaciones
Algebra Tarea
7 páginas
Guía de Estudio Regresión Lineal
Aún no hay calificaciones
Guía de Estudio Regresión Lineal
9 páginas
Regresion en Phyton
Aún no hay calificaciones
Regresion en Phyton
3 páginas
# Estandarizacion, Regresion Con Features Escalados y Predicciones
Aún no hay calificaciones
# Estandarizacion, Regresion Con Features Escalados y Predicciones
6 páginas
Tema 10
Aún no hay calificaciones
Tema 10
88 páginas
Temario Extensiones Econometría
Aún no hay calificaciones
Temario Extensiones Econometría
65 páginas
Modulo 3
Aún no hay calificaciones
Modulo 3
35 páginas
P5 1 R SofiaJatziriRosalesRamos
Aún no hay calificaciones
P5 1 R SofiaJatziriRosalesRamos
20 páginas
InformeModelamiento Estadistico
Aún no hay calificaciones
InformeModelamiento Estadistico
9 páginas
Electiva Quimica
Aún no hay calificaciones
Electiva Quimica
10 páginas
Regresión Lineal
Aún no hay calificaciones
Regresión Lineal
9 páginas

Programación Lineal en Python

Cargado por

Programación Lineal en Python

Cargado por

Programación Lineal en python

June 12, 2022

Regresión lineal en python

### importar el paquete para regresión lineal

## ignorar las advertencias

[6]: datos = pd.read_csv("mundo.csv") ## cargamos la base de datos

datos.head(10) ## primeras 10 observaciones

[6]: country year population continent life_exp gdp_cap

[7]: Text(0, 0.5, 'Esperanza de vida')

modelo.fit(X= explicativa, y = explicada) ## corremos el modelo

modelo.__dict__ ## vemos los resultados del modelo

[8]: {'fit_intercept': True,

entonces aplicamos el modelo con el metodo predict, y se lo aplicamos a valores de X, es decir

## añadimos la prediccion a la base de datos

datos.insert(0, "prediccion", prediccion)

[9]: prediccion country year population continent life_exp gdp_cap

[10]: Text(0, 0.5, 'Esperanza de vida')

También podría gustarte

modelo.dict ## vemos los resultados del modelo