0% encontró este documento útil (0 votos)
147 vistas12 páginas

Algoritmos de Regresión

Este documento presenta varios algoritmos de regresión como regresión logística, regresión lineal y regresión no lineal. También explica conceptos de machine learning como matriz de confusión, precisión, recall y especificidad.

Cargado por

molkazz
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
147 vistas12 páginas

Algoritmos de Regresión

Este documento presenta varios algoritmos de regresión como regresión logística, regresión lineal y regresión no lineal. También explica conceptos de machine learning como matriz de confusión, precisión, recall y especificidad.

Cargado por

molkazz
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd
Está en la página 1/ 12

 

     
Universidad Tecnológica
Santa Catarina

Parcial 2

Nombre:

Grupo: Matricula:

Santa Catarina NL a 05 junio 2021


Algoritmos de Regresión...................................................................................................3

Regresión Logística...........................................................................................................3

ALGORITMO DE REGRESIÓN LOGÍSTICA BINARIA.................................................4

ALGORITMO DE REGRESIÓN LOGÍSTICA MULTINOMIAL.......................................4

REGRESIÓN LINEAL........................................................................................................4

ALGORITMO DE REGRESIÓN LINEAL BAYESIANA..................................................5

ALGORITMO DE MÍNIMOS CUADRADOS ORDINARIOS (OLS)................................5

REGRESIÓN NO LINEAL.................................................................................................6

ALGORITMO DE LÍNEAS DE REGRESIÓN ADAPTATIVAS MULTIVARIANTES


(MARS)...........................................................................................................................6

ALGORITMO DE REGRESIÓN LOCAL (LOESS O LOWESS)....................................7

Machine Learning: Confusión Matrix.................................................................................7

Machine Learning: Accuracy (Precisión)...........................................................................8

Machine Learning: Recall, Sensibilidad o TPR (Tasa de True Positive)..........................9

Machine Learning: Precisión.............................................................................................9

Precisión VS recall...........................................................................................................10

Especificidad o TNR (Tasa Negativa Verdadera)...........................................................11

Bibliografia.......................................................................................................................12
Algoritmos de Regresión

Las técnicas de regresión tienen como objetivo clasificar o predecir valores a partir de
datos históricos. En los problemas de regresión se trata de predecir los resultados
asignando las variables de entrada con una función continua.

Regresión Logística
Se trata de un algoritmo relativamente sencillo para resolver problemas de clasificación.
Concretamente se asemeja a una red neuronal con una única neurona. La regresión
logística se asocia con una función matemática acotada entre los valores 0 (valor
mínimo) y 1 (valor máximo), que permite interpretar los resultados obtenidos como
probabilidades a partir de la baremación de esos valores.
ALGORITMO DE REGRESIÓN LOGÍSTICA BINARIA

Varía en dos categorías a clasificar acotadas entre 0 y 1. Se puede presuponer que los
resultados que proporcionen valores menores a 0.5 pertenecen a la clase 0 y los
resultados con valores superiores a 0.5 corresponden a la clase 1.

ALGORITMO DE REGRESIÓN LOGÍSTICA MULTINOMIAL

Se trata de la dependencia de más de dos categorías en la clasificación. Es una


variante de la regresión logística binaria clásica.

REGRESIÓN LINEAL
La regresión lineal trata de predecir un valor de una variable dependiente basándose
en una variable independiente (el valor dado previamente). Lo que supone estudiar una
relación lineal entre ambas variables que al mostrarse de manera visual en una gráfica
se vería representado en una línea recta que se ajuste a los puntos de los datos, tal y
como se muestra en la imagen. Los algoritmos de regresión lineal tienen como objetivo
predecir valores continuos a partir de datos históricos etiquetados. Los siguientes
algoritmos de regresión lineal se diferencian en la forma de cálculo de la función
asociada.
ALGORITMO DE REGRESIÓN LINEAL BAYESIANA

El objetivo del algoritmo de regresión lineal bayesiana no es encontrar el único “mejor”


valor de los parámetros del modelo, sino más bien determinar la distribución posterior
de los parámetros 3. Es decir, este algoritmo trata de coger datos iniciales aleatorios de
los parámetros del modelo para hacer una predicción intuitiva de los datos finales del
modelo. Cuantos más datos entrene el modelo, menos incertidumbre hay en la
predicción, por eso mismo este algoritmo es más útil cuando el nivel de datos que se
manejan es elevado. Si no es así, la predicción será menos exacta.

ALGORITMO DE MÍNIMOS CUADRADOS ORDINARIOS (OLS)

También denominado Regresión Lineal Simple. Se trata de uno de los algoritmos de


aproximación cuya función principal es minimizar la distancia para poder realizar
estimaciones. A menudo muestra ineficiencia, especialmente con grandes variaciones
e intervalos amplios, lo que dificulta la estimación precisa cuando hay una fuerte
multicolinealidad 4. Este algoritmo repite operaciones con las diferencias entre los
valores que predice y los valores reales y, posteriormente, lo ajusta al cuadrado y
calcula una suma de todos los errores. La suma obtenida se eleva al cuadrado y se
minimiza para mejorar la estimación. Para este tipo de algoritmos es recomendable
utilizar un conjunto de valores que estén altamente correlacionados entre sí para evitar
valores atípicos e incertidumbre en los resultados.
REGRESIÓN NO LINEAL

Los algoritmos de regresión no lineal se identifican en que la relación entre variables


dependientes e independientes se modelan como una función no lineal. Esencialmente,
cualquier relación que no sea lineal, puede denominarse no línea 5. Esto implica que
los algoritmos no lineales pueden ajustarse a más tipos de curvas, aunque requiera
más esfuerzo encontrar el mejor ajuste.

ALGORITMO DE LÍNEAS DE REGRESIÓN ADAPTATIVAS


MULTIVARIANTES (MARS)

El algoritmo MARS es flexible al buscar las interacciones y relaciones entre las


variables dependientes e independientes. Este algoritmo se identifica por tener dos
etapas. En la primera etapa se busca minimizar el error cuadrático y en la segunda fase
busca una validación cruzada de las selecciones para así aproximarse a los valores
reales.
ALGORITMO DE REGRESIÓN LOCAL (LOESS O LOWESS)

Este algoritmo combina parte de la simplicidad de los algoritmos de regresión lineal con
la flexibilidad que proporcionan los algoritmos de regresión no lineal, permitiendo así
ajustar los modelos de datos para construir una función. Se utiliza para procedimientos
en los que se necesita bastante exactitud sin requerir un esfuerzo excesivo

Machine Learning: Confusión Matrix

Confusión o error Matrix es una tabla que describe el rendimiento de un modelo


supervisado de Machine Learning en los datos de prueba, donde se desconocen los
verdaderos valores. Se llama “matriz de confusión” porque hace que sea fácil detectar
dónde el sistema está confundiendo dos clases.

1. True Positives (TP): cuando la clase real del punto de datos era 1 (Verdadero) y
la predicha es también 1 (Verdadero)
2. Verdaderos Negativos (TN): cuando la clase real del punto de datos fue 0
(Falso) y el pronosticado también es 0 (Falso).
3. False Positives (FP): cuando la clase real del punto de datos era 0 (False) y el
pronosticado es 1 (True).
4. False Negatives (FN): Cuando la clase real del punto de datos era 1 (Verdadero)
y el valor predicho es 0 (Falso).
Machine Learning: Accuracy (Precisión)

Es el porcentaje total de elementos clasificados correctamente.

Es la medida más directa de la calidad de los clasificadores. Es un valor entre 0 y 1.


Cuanto más alto, mejor.

Esta métrica es tan intuitiva y natural, de hecho, que las personas a menudo la utilizan
sin pensarlo dos veces, aunque ciertamente no es apropiado en muchos casos.

Desventaja significativa

Obviamente la mejor constante para predecir en el caso de precisión es la clase más


frecuente. Sin embargo, esto puede ocasionar problemas si las clases de variables de
destino en los datos no están balanceadas.

Ejemplo: Digamos que tenemos 10 gatos y 90 perros en nuestro conjunto de trenes.


Entonces, el problema es que la precisión de la línea de base puede ser muy alta para
un conjunto de datos, incluso del 99%, y eso lo hace difícil para interpretar los
resultados.

Machine Learning: Recall, Sensibilidad o TPR


(Tasa de True Positive)

Es el número de elementos identificados correctamente como positivos del total de


positivos verdaderos

Machine Learning: Precisión

Es el número de elementos identificados correctamente como positivo de un total de


elementos identificados como positivos.
Precisión VS recall

Está claro que Recall nos da información sobre el rendimiento de un clasificador con
respecto a falsos negativos (cuántos fallaron), mientras que la precisión nos
proporciona información sobre su rendimiento con respecto a los falsos positivos
(cuántos capturados).

Precisión trata de ser preciso. Entonces, incluso si logramos capturar solo un caso de
cáncer y lo capturamos correctamente, entonces somos 100% precisos.

Recall no se trata tanto de capturar casos correctamente sino más de capturar todos
los casos que tenemos con la respuesta. Entonces, si siempre decimos cada caso
tenemos un recuerdo del 100%.

Entonces, básicamente, si queremos enfocarnos más en minimizar los falsos


negativos, deseamos que nuestro recuerdo sea lo más cercano posible al 100% sin la
precisión es muy mala y si queremos enfocarnos en minimizar los falsos positivos,
entonces nuestro enfoque debe orientarse a hacer que la Precisión sea lo más cercana
posible al 100%

Especificidad o TNR (Tasa Negativa Verdadera)

Es el número de ítems correctamente identificados como negativos fuera del total de


negativos.

La especificidad es exactamente lo opuesto a Recall.


Bibliografia

Algoritmos de Regresión. (2020, 22 septiembre). Algoritmos de Inteligencia Artificial en


Python. https://algorithmclasses.com/algoritmos-de-regresion/

Núñez, E. (2011, 1 junio). Estrategias para la elaboración de modelos estadísticos de


regresión | Revista Española de Cardiología. revespcardiol.
https://www.revespcardiol.org/es-estrategias-elaboracion-modelos-estadisticos-
regresion-articulo-S0300893211003502

También podría gustarte