0% encontró este documento útil (0 votos)

16 vistas3 páginas

Resumen Python 3 Machine Learning

El documento proporciona una guía sobre el uso de Scikit-Learn para aprendizaje automático en Python, incluyendo instalación, importación de datasets y técnicas de preprocesamiento. Se detallan estimadores para clasificación, regresión y agrupación, así como el uso de pipelines y validación de modelos. Además, se mencionan métricas para evaluar el rendimiento de los modelos y métodos para guardar y cargar modelos entrenados.

Cargado por

jl.iglesias.feria

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como PDF, TXT o lee en línea desde Scribd

0% encontró este documento útil (0 votos)

16 vistas3 páginas

Resumen Python 3 Machine Learning

Cargado por

jl.iglesias.feria

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como PDF, TXT o lee en línea desde Scribd

Está en la página 1/ 3

Python Machine Learning

Scikit-Learn
• Uso Principal: algoritmos de aprendizaje automático.
• Instalación: sudo pip3 install scikit-learn
• Importación: import sklearn
• Datasets:
from sklearn import datasets # Todos están en el mismo espacio de nombres.
iris = datasets.load_iris() # Existen múltiples (BD pequeñas), se cargan con ‘load_<ds>()’.
news = datasets.fetch_20newsgroups() # BD más grandes, se descargan con ‘fetch_<ds>()’.
generado = datasets.make_blobs # BD generadas, todas son ‘make_<ds>()’.
datos = iris.data # Array de numpy de tamaño (n_samples, n_features).
cols = iris.feature_names # Nombres de las columnas con los datos.
categ = iris.target # Categoría a la que pertenece cada ejemplo (índice).
categ = iris.target_names # Nombres de las categorías.
arch = iris.filename # Ruta completa al archivo físico con los datos.
descri = iris.DESCR # Texto descriptivo del conjunto de datos.
• Utilidades:
from.sklearn.model_selection import train_test_split
x_trn, y_trn, x_val, y_val = train_test_split(x, y, train_size=0.8, test_size=0.2)
from sklearn.model_selection import GridSearchCV # Buscar mejores parámetros.
params = {'pca__n_components': [5, 20, 30, 40, 50, 64], 'logistic__alpha': np.logspace(-4, 4, 5)}
search = GridSearchCV(tubo, params, iid=False, cv=5) # “tubo” es un pipeline.
search.best_params_ # Mejor combinación de parámetros.
search.best_score_ # Mejor puntuación encontrada.
from sklearn.inspection import plot_partial_dependence
plot_partial_dependence(estimador, X, atributos) # Mostrar gráficos con dependencias
• Preprocesado:
from sklearn.compose import ColumnTransformer
from sklearn.pipeline import Pipeline
from sklearn.impute import SimpleImputer
from sklearn.preprocessing import OneHotEncoder
from sklearn.preprocessing import LabelEncoder
numerical_transformer = SimpleImputer(strategy='constant') # Datos numéricos.
categorical_transformer = Pipeline(steps=[ # Datos categóricos.
('imputer', SimpleImputer(strategy='most_frequent')),
('onehot', OneHotEncoder(handle_unknown='ignore'))])
preprocessor = ColumnTransformer(
transformers=[
('num', numerical_transformer, numerical_cols),
('cat', categorical_transformer, categorical_cols)])
encoder = LabelEncoder()
encoded = ks[['cat1', 'cat2', 'cat3']].apply(encoder.fit_transform) # Categóricos → Enteros
from sklearn.preprocessing import LabelBinarizer
from sklearn.preprocessing import MultiLabelBinarizer
y = LabelBinarizer().fit_transform(y) # Salidas con array one-hot. [0, 0, 1, 0, 0]
y = MultiLabelBinarizer().fit_transform(y) # Salidas con arrays multi-hot. [1, 0, 1, 0, 1]
from sklearn import preprocessing
procesado = preprocessing.normalize(X, norm=’l2’) # Entre cero y uno.
procesado = preprocessing.scale(X) # Media cero y varianza uno.
procesado = preprocessing.minmax_scale(X) # Entre un mínimo y un máximo.
procesado = preprocessing.robust_scale(X) # Ignora los outliners.
procesado = preprocessing.quantile_scale(X) # Redondea hacia los cuantiles indicados.
escala = preprocessing.Normalizer()
escala = preprocessing.StandardScaler()
escala = preprocessing.MinMaxScaler()

1
escala = preprocessing.RobustScaler()
escala = preprocessing.QuantileTransformer()
escala = preprocessing.PowerTransformer(method='box-cox') # A curva gaussiana.
from sklearn.preprocessing import OrdinalEncoder() # Categóricas → Numéricas (1...n)
from sklearn.preprocessing import OneHotEncoder() # Categóricas → Numéricas (One-Hot)
from sklearn.preprocessing import KBinsDiscretizer() # Discretizar valores continuos.
from sklearn.preprocessing import Binarizer() # Discretización booleana según umbral.
discreto = KBinsDiscretizer(encode=’ordinal’)
binario = Binarizer(threshold=0.75)
from sklearn.preprocessing import PolynomialFeatures # Agregar componentes polinómicos.
poly = PolynomialFeatures(2) # Generar modelo de orden cuadrático.
from sklearn.preprocessing import FunctionTransformer # Transformaciones personalizadas.
transformador = FunctionTransformer(np.log1p, validate=True)
from sklearn.impute import MissingIndicator # Indica si hay o no valores nulos.
from sklearn.experimental import enable_iterative_imputer
from sklearn.impute import SimpleImputer
from sklearn.impute import IterativeImputer
imp = SimpleImputer(missing_values=np.nan, strategy='mean') # Pasar NaN a media de columna.
imp = IterativeImputer() # Más complejas y cuando depende de otras columnas.
• Estimadores: objetos que aprenden (fit) y realizan predicciones (predict).
◦ Clasificación:
from sklearn.neighbors import KNeighborsClassifier
knn = KNeighborsClassifier(leaf_size=30, metric='minkowski', n_neighbors=5)
knn.fit(X_trn, y_trn)
y_pred = knn.predict(X_tst)
from sklearn.linear_model import LogisticRegression
logreg = LogisticRegression(solver='lbfgs', multi_class='multinomial')
probabilidades = logreg.predic_proba(X)
from sklearn.linear_model import RidgeClassifier
ridge = RidgeClassifier(alpha=0.1)
from sklearn.ensemble import RandomForestRegressor
bosque = RandomForestRegressor(n_estimators=100)
from sklearn.svm import SVC
svc = SVC(C=500, gamma='scale', kernel=’rbf’)
from sklearn.neural_network import MLPClassifier
mlp = MLPClassifier(hidden_layer_sizes=[50, 100, 50, ], solver='adam', alpha=0.0001,
batch_size='auto', momentum=0.9, beta_1=0.9, beta_2=0.999, epsilon=1e-8)
from sklearn.multiclass import OneVsRestClassifier
clf = OneVsRestClassifier(estimator=estimador)
◦ Regresión:
from sklearn.linear_model import LinearRegression
lin = LinearRegression()
from sklearn.linear_model import Ridge
ridge = Ridge(alpha=0.1)
from sklearn.linear_model import Lasso
lasso = Lasso(alpha=0.1)
from sklearn.svm import SVR
svr = SVR(C=500, gamma='scale', kernel=’rbf’)
from xgboost import XGBRegressor
xgb = XGBRegressor(n_estimators=500, learning_rate=0.5, n_jobs=4)
xgb.set_param(learning_rate=0.05) # Cambiar el valor de un parámetro.
◦ Agrupación:
from sklearn.cluster import KMeans
grupos = KMeans(n_clusters=3)
grupos.labels_ # Agrupaciones realizadas.

2
grupos.cluster_centers_ # Datos de centroides.
from sklearn.cluster import FeatureAgglomeration
from sklearn.feature_extraction.image import grid_to_graph
aglomera = FeatureAgglomeration(conectivity=grid_to_graph(…), n_clusters=32)
reducido = aglomera.transform(X) # Reducción de dimensionalidad.
aproximada = aglomera.inverse_transform(reducido) # Recuperar de reducción.
from sklearn.decomposition import PCA
pca = PCA(n_components=5)
pca.components_ # Autovectores
pca.explained_variance_ # Autovalores
• Pipeline:
from sklearn.pipeline import Pipeline
tubo = Pipeline(steps=[('preprocesar', prep), ('pca', pca), ('logistic', logistic)])
tubo.steps # Pasos que se realizan dentro del pipeline.
tubo[0] # Acceder al paso directamente, según índice.
tubo[‘pca’] # Acceder al paso directamente, según clave.
tubo.set_params(pca__C=10) # Parámetros de estimadores: <estimador>__<parámetro>.
tubo.fit(X_train, y_train)
preds = tubo.predict(X_valid)
from sklearn.pipeline import make_pipeline
make_pipeline(Binarizer(), MultinomialNB())
• Validación:
from sklearn.model_selection import cross_val_score
score = mean_absolute_error(y_valid, preds)
scores = -1 * cross_val_score(my_pipeline, X, y, cv=5, scoring='accuracy')
• Guardar/Cargar Modelos: se suelen usar pickle (memoria) y joblib (disco).
import pickle
stm = pickle.dump(estimador)
estimador = pickle.loads(stm)
from joblib import dump, load
dump(estimador, ‘archivo.joblib’)
estimador = load(‘archivo.joblib’)
• Características Principales:
from sklearn.feature_selection import RFE # Recursive Feature Elimination
selector = RFE(modelo, 2, step=1) # modelo = LinearRegression(), por ejemplo.
selector = selector.fit(X, y)
selector.support_ # Indica con booleanos las variables principales.
selector.ranking_ # Indica el orden de las variables según su importancia.
• Métricas:
from sklearn import metrics
accuracy_score(Y_real, Y_predicho)
pecision_score(Y_real, Y_predicho)
recall_score(Y_real, Y_predicho)
confusion_matrix(Y_real, Y_predicho)
f1_score(Y_real, Y_predicho)
r2_score(Y_real, Y_predicho)
especf, sensib, umbrales = metrics.roc_curve(Y, probabilidades)
auc(especf, sensib)
mean_absolute_error(Y_real, Y_predicho)
mean_squared_error(Y_real, Y_predicho)
mean_squared_log_error(Y_real, Y_predicho)
median_absolute_error(Y_real, Y_predicho)
r2_score(Y_real, Y_predicho)
pairwise_distances(X)
manhattan_distances(X)
•

También podría gustarte

115 Ejercicios resueltos de programación C++
De Everand
115 Ejercicios resueltos de programación C++
Jorge Fernando Betancourt Uscátegui
3.5/5 (7)
Machine Learning Con Python Aprendizaje Supervisado
100% (1)
Machine Learning Con Python Aprendizaje Supervisado
114 páginas
Un Invierno Junto Al Mar - Julie Klassen
Aún no hay calificaciones
Un Invierno Junto Al Mar - Julie Klassen
403 páginas
Manual de Base de Datos Con Erdplus
Aún no hay calificaciones
Manual de Base de Datos Con Erdplus
10 páginas
Machine Learning Con Python Aprendizaje Supervisado Spanish Edition
83% (6)
Machine Learning Con Python Aprendizaje Supervisado Spanish Edition
111 páginas
Guía de Referencia de Scikit-Learn
Aún no hay calificaciones
Guía de Referencia de Scikit-Learn
1 página
Scikit Learn Es
Aún no hay calificaciones
Scikit Learn Es
27 páginas
Ejercicio 7
Aún no hay calificaciones
Ejercicio 7
21 páginas
Python For Machine Learning 6-10
Aún no hay calificaciones
Python For Machine Learning 6-10
3 páginas
Implementacion Algoritmos KNN
Aún no hay calificaciones
Implementacion Algoritmos KNN
6 páginas
Ejercicio 2
Aún no hay calificaciones
Ejercicio 2
7 páginas
Modulo4 Qué Es El Machine Learning
Aún no hay calificaciones
Modulo4 Qué Es El Machine Learning
5 páginas
Documento Falta Terminar
Aún no hay calificaciones
Documento Falta Terminar
10 páginas
Scikit Learn
Aún no hay calificaciones
Scikit Learn
3 páginas
6RN Con Sklearn 3
Aún no hay calificaciones
6RN Con Sklearn 3
38 páginas
Algoritmos Machine Learning D6-7 8 12-06-2020
100% (1)
Algoritmos Machine Learning D6-7 8 12-06-2020
32 páginas
Sklearn Guion
Aún no hay calificaciones
Sklearn Guion
9 páginas
Cómo Entrenar Un Modelo de Machine Learning Con Scikit
Aún no hay calificaciones
Cómo Entrenar Un Modelo de Machine Learning Con Scikit
4 páginas
Informe Final Trabajo de Grado - Seminario
Aún no hay calificaciones
Informe Final Trabajo de Grado - Seminario
20 páginas
Ejercicio 6
Aún no hay calificaciones
Ejercicio 6
10 páginas
9 15RN Con Sklearn 1
Aún no hay calificaciones
9 15RN Con Sklearn 1
18 páginas
Machine Learning Con Python Aprendizaje Supervisado (Spanish Edition) (Ligdimar González (González, Ligdimar) )
Aún no hay calificaciones
Machine Learning Con Python Aprendizaje Supervisado (Spanish Edition) (Ligdimar González (González, Ligdimar) )
119 páginas
Codigos Python Bocanegra
Aún no hay calificaciones
Codigos Python Bocanegra
3 páginas
Modulo4 Qué Es El Machine Learning V2
Aún no hay calificaciones
Modulo4 Qué Es El Machine Learning V2
9 páginas
Ilovepdf Merged
Aún no hay calificaciones
Ilovepdf Merged
248 páginas
Practica de Laboratorio # 2 Big Data Proyecto de Aprendizaje Automático en Python
Aún no hay calificaciones
Practica de Laboratorio # 2 Big Data Proyecto de Aprendizaje Automático en Python
13 páginas
Preprocesamiento
Aún no hay calificaciones
Preprocesamiento
5 páginas
5 +fase+de+modelado+ (Pres)
Aún no hay calificaciones
5 +fase+de+modelado+ (Pres)
50 páginas
Clase 2
Aún no hay calificaciones
Clase 2
37 páginas
6RN Con Sklearn 5
Aún no hay calificaciones
6RN Con Sklearn 5
14 páginas
Resolución de Problemas Matemáticos o Técnicos
Aún no hay calificaciones
Resolución de Problemas Matemáticos o Técnicos
14 páginas
Clase 6 - 7 Clasificación Binaria de Un Sonar
Aún no hay calificaciones
Clase 6 - 7 Clasificación Binaria de Un Sonar
11 páginas
PY020 Machine Learning
Aún no hay calificaciones
PY020 Machine Learning
24 páginas
Pronostico Multivariado Aplicando Inteligencia Artificial
Aún no hay calificaciones
Pronostico Multivariado Aplicando Inteligencia Artificial
11 páginas
Tarea Semana5 Bryan Villarruel
100% (1)
Tarea Semana5 Bryan Villarruel
16 páginas
Advanced House Price ML Model
Aún no hay calificaciones
Advanced House Price ML Model
2 páginas
Curso Básico de Machine Learning PDF
Aún no hay calificaciones
Curso Básico de Machine Learning PDF
49 páginas
Sesion1 Machine Learning
Aún no hay calificaciones
Sesion1 Machine Learning
19 páginas
Aprendizaje Automatico - Parte 1
Aún no hay calificaciones
Aprendizaje Automatico - Parte 1
88 páginas
Tensorflow y Scikit Español Prev
Aún no hay calificaciones
Tensorflow y Scikit Español Prev
6 páginas
Curso Profesional de Scikit Learn - 43223611 0b12 43ec b05b 1e95c5
Aún no hay calificaciones
Curso Profesional de Scikit Learn - 43223611 0b12 43ec b05b 1e95c5
115 páginas
S03 InstalarPython
Aún no hay calificaciones
S03 InstalarPython
27 páginas
Machine Learning Es PDF
100% (4)
Machine Learning Es PDF
76 páginas
Intro Machine Learning
Aún no hay calificaciones
Intro Machine Learning
14 páginas
Analisis Datos Meteorologicos
Aún no hay calificaciones
Analisis Datos Meteorologicos
5 páginas
5 Ejercicio - Experimentación Con Los Modelos de Regresión Más Eficaces - Training - Microsoft Learn
Aún no hay calificaciones
5 Ejercicio - Experimentación Con Los Modelos de Regresión Más Eficaces - Training - Microsoft Learn
9 páginas
Clase 9
Aún no hay calificaciones
Clase 9
26 páginas
ExamenSustitutorio CC421
Aún no hay calificaciones
ExamenSustitutorio CC421
11 páginas
Redes Neuronales
Aún no hay calificaciones
Redes Neuronales
5 páginas
Ia Basico S3
Aún no hay calificaciones
Ia Basico S3
14 páginas
TP IA Marketin
Aún no hay calificaciones
TP IA Marketin
17 páginas
Implementacion de Machine Learning para Recetar Medicamentos Basado en Sintomas
Aún no hay calificaciones
Implementacion de Machine Learning para Recetar Medicamentos Basado en Sintomas
11 páginas
Clasificador Iris
Aún no hay calificaciones
Clasificador Iris
3 páginas
Resumen Ampliado Introduction ML Python
Aún no hay calificaciones
Resumen Ampliado Introduction ML Python
3 páginas
Semana1b - Modelo de Aprendizaje Automático Simple Que Realiza Una Tarea de Clasificación
Aún no hay calificaciones
Semana1b - Modelo de Aprendizaje Automático Simple Que Realiza Una Tarea de Clasificación
8 páginas
Explorador M2
Aún no hay calificaciones
Explorador M2
43 páginas
Parte 1
Aún no hay calificaciones
Parte 1
7 páginas
Entregable 3 - 1919543
Aún no hay calificaciones
Entregable 3 - 1919543
16 páginas
Sensores
Aún no hay calificaciones
Sensores
4 páginas
Clase 5 - 7 Clasificación Multiclase
Aún no hay calificaciones
Clase 5 - 7 Clasificación Multiclase
7 páginas
Resumen Ampliado Introduction ML Python
Aún no hay calificaciones
Resumen Ampliado Introduction ML Python
3 páginas
12 Proyectos de programacion Nivel principiante: 50 Proyectos de Programacion para Practicar y Aprender, #1
De Everand
12 Proyectos de programacion Nivel principiante: 50 Proyectos de Programacion para Practicar y Aprender, #1
Enrique Vicente
Aún no hay calificaciones
Unbalanced
Aún no hay calificaciones
Unbalanced
4 páginas
Teoria
Aún no hay calificaciones
Teoria
5 páginas
Anual Kinder Inglés
Aún no hay calificaciones
Anual Kinder Inglés
10 páginas
Sesión 6 - Principios de Algoritmos
Aún no hay calificaciones
Sesión 6 - Principios de Algoritmos
20 páginas
Noel
Aún no hay calificaciones
Noel
1 página
2.3 Aammee
100% (1)
2.3 Aammee
19 páginas
Antropologia Biblica. Tiempos de Gracia
50% (2)
Antropologia Biblica. Tiempos de Gracia
9 páginas
La Ciencia Secreta de Los Mapuches
Aún no hay calificaciones
La Ciencia Secreta de Los Mapuches
136 páginas
Clases de Conjuntos
Aún no hay calificaciones
Clases de Conjuntos
9 páginas
Lista Adverbios en Ingles PDF
Aún no hay calificaciones
Lista Adverbios en Ingles PDF
4 páginas
Para Demoler La Pirámide Invertida
Aún no hay calificaciones
Para Demoler La Pirámide Invertida
12 páginas
Guia 8° #1
Aún no hay calificaciones
Guia 8° #1
3 páginas
Tipos de Materialismo
100% (1)
Tipos de Materialismo
5 páginas
Stefenel Miscel
Aún no hay calificaciones
Stefenel Miscel
381 páginas
TEMA VOCACIONAL NÚMERO 2: DEDICADO A NIÑOS
Aún no hay calificaciones
TEMA VOCACIONAL NÚMERO 2: DEDICADO A NIÑOS
7 páginas
Bibliografia11 Salmos
Aún no hay calificaciones
Bibliografia11 Salmos
7 páginas
Historia 3ro Bgu Planificación
Aún no hay calificaciones
Historia 3ro Bgu Planificación
6 páginas
La Predicacin de La Cruz
Aún no hay calificaciones
La Predicacin de La Cruz
9 páginas
La Conducta Del Cristiano
Aún no hay calificaciones
La Conducta Del Cristiano
3 páginas
Pereyra 2019 BB
Aún no hay calificaciones
Pereyra 2019 BB
6 páginas
Propuesta Didáctica Nivel 1
Aún no hay calificaciones
Propuesta Didáctica Nivel 1
14 páginas
Algoritmos de Compresión y Sus Tipos
100% (1)
Algoritmos de Compresión y Sus Tipos
3 páginas
Comentario de Texto
Aún no hay calificaciones
Comentario de Texto
2 páginas
1 Hoja de Ruta Modelo 2025
Aún no hay calificaciones
1 Hoja de Ruta Modelo 2025
3 páginas
Diptongo, Triptongo e Hiato
Aún no hay calificaciones
Diptongo, Triptongo e Hiato
3 páginas
Experiencia de Aprendizaje 2 - Actividad 14 - Comunicación - (Vii Ciclo)
Aún no hay calificaciones
Experiencia de Aprendizaje 2 - Actividad 14 - Comunicación - (Vii Ciclo)
4 páginas
Escribimos Mensajes A Papá para Valorarlo
Aún no hay calificaciones
Escribimos Mensajes A Papá para Valorarlo
4 páginas
Cuentos y Leyendas Populares
Aún no hay calificaciones
Cuentos y Leyendas Populares
6 páginas