Machine Learning Es
Machine Learning Es
Consulte los debates, estadísticas y perfiles de los autores de esta publicación en: https://www.researchgate.net/publication/344717762
CITACIONE LEA
S
206,571
441
1 autor:
Batta Mahesh
Investigador independiente
5 PUBLICACIONES 444 CITAS
VER PERFIL
Todo el contenido de esta página fue cargado por Batta Mahesh el 17 de octubre de 2020.
Batta Mahesh
Resumen: El aprendizaje automático (Machine Learning, ML) es el estudio científico de algoritmos y modelos estadísticos que los
sistemas informáticos utilizan para realizar una tarea específica sin ser programados explícitamente. Los algoritmos de aprendizaje en
muchas aplicaciones de las que hacemos uso a diario. Cada vez que se utiliza un motor de búsqueda web como Google para buscar en
Internet, una de las razones por las que funciona tan bien es porque un algoritmo de aprendizaje que ha aprendido a clasificar las
páginas web. Estos algoritmos se utilizan para diversos fines, como la minería de datos, el procesamiento de imágenes, el análisis
predictivo, etc., por nombrar algunos. La principal ventaja de utilizar el aprendizaje automático es que, una vez que un algoritmo
aprende qué hacer con los datos, puede realizar su trabajo automáticamente. En este artículo se hace un breve repaso y una perspectiva
de futuro de las vastas aplicaciones de los algoritmos de aprendizaje automático.
Palabras clave: Algoritmo, Aprendizaje automático, Pseudocódigo, Aprendizaje supervisado, Aprendizaje no supervisado, Aprendizaje por
refuerzo
El aprendizaje automático se basa en distintos algoritmos entrada-salida. Infiere una función a partir de datos de
para resolver problemas de datos. A los científicos de datos entrenamiento etiquetados que consisten en un conjunto de
les gusta señalar que no existe un único tipo de algoritmo ejemplos de entrenamiento. Los algoritmos de aprendizaje
que sirva para todo y que sea el mejor para resolver un automático supervisado son aquellos que necesitan ayuda
problema. El tipo de algoritmo empleado depende del tipo externa. El conjunto de datos de entrada se divide en un
de problema que se quiera resolver, el número de variables, conjunto de datos de entrenamiento y un conjunto de datos de
el tipo de modelo que mejor se adapte, etc. He aquí un breve prueba. El conjunto de datos de entrenamiento contiene
repaso a algunos de los algoritmos más utilizados en el variables de salida que deben predecirse o clasificarse. Todos
aprendizaje automático (AM) los algoritmos
Aprendizaje supervisado
El aprendizaje supervisado es la tarea de aprendizaje
automático que consiste en aprender una función que asigna
una entrada a una salida basándose en pares de ejemplos de
Volumen 9 Número 1, enero de 2020
www.ijsr.net
Con licencia Creative Commons Reconocimiento CC
BY
ID de papel: 381
Revista Internacional de Ciencia e Investigación
(IJSR)
aprender algún tipo de patrón del conjunto de datos ISSN:
de 2319-7064
Factor dedeimpacto
entrenamiento y aplicarlo al conjunto de prueba
datos de ResearchGate (2018): 0,28 | SJIF (2018):
para la predicción o clasificación. El flujo de trabajo de los 7.426
algoritmos de aprendizaje automático supervisado se
muestra en la siguiente figura. A continuación se describen
los algoritmos de aprendizaje automático supervisado más
conocidos
Figura: Flujo de trabajo del aprendizaje
supervisado
Pseudocódigo de Navie
Bayes Input:
Conjunto de datos de entrenamiento T,
F= (f1, f2, f3,.., fn) // valor de la variable predictora en el
conjunto de datos de prueba.
Salida: Una clase de conjunto de datos de prueba.
Pasos:
1) Lee el conjunto de datos de entrenamiento T;
Figura: Árbol de decisión 2) Calcule la media y la desviación típica de las variables
predictoras de cada clase;
Pseudocódigo de árbol de decisión: 3) Repetir Calcular la probabilidad de fi mediante la
def ecuación de densidad de gauss en cada clase; Hasta que
decisionTreeLearning(ejemplos, atributos, ejemplos_padre): se haya calculado la probabilidad de todas las variables
si len(ejemplos) == 0: predictoras (f1, f2, f3,.., fn).
return pluralidadValor(padre_ejemplos) 4) Calcule la probabilidad de cada clase;
# devuelve la respuesta más probable ya que no quedan 5) Obtener la mayor probabilidad
datos de entrenamiento
elif len(attributes) == 0: Máquina de vectores soporte
return pluralidadValor(ejemplos) Otra de las técnicas de aprendizaje automático más
elif (todos los ejemplos clasifican igual): utilizadas es la máquina de vectores de soporte (SVM).
devolver su clasificación Enmachine learning, son modelos de
A = max(atributos, clave(a)=importancia(a, ejemplos) aprendizaje supervisado con algoritmos de aprendizaje
# elige el atributo más prometedor para condicionarlo asociados que analizan los datos utilizados para la
tree = new Tree(raíz=A) clasificación y el análisis de regresión. Además de realizar
para valor en A.valores(): una clasificación lineal, las SVM pueden realizar
exs = ejemplos[e.A == valor] eficientemente una clasificación no lineal utilizando lo que
subárbol = decisionTreeLearning(exs, attributes.remove(A), se denomina el truco del kernel, mapeando implícitamente
ejemplos) sus entradas en espacios de características de alta dimensión.
# nota la implementación probablemente debería envolver Básicamente, dibuja márgenes entre las clases. Los
los retornos de los casos triviales en árboles por coherencia márgenes se trazan de forma que la distancia entre el margen
tree.addSubtreeAsBranch(subtree, label=(A, value) y las clases sea máxima y, por tanto, se minimice el error de
devolver árbol clasificación.
Navie Bayes
Se trata de una técnica de clasificación basada en el Teorema
de Bayes con un supuesto de independencia entre los
predictores. En términos sencillos, un clasificador Naive
Bayes asume que la presencia de una característica concreta
en una clase no está relacionada con la presencia de ninguna
otra característica. El Bayes ingenuo se dirige
principalmente al sector de la clasificación de textos. Se
utiliza principalmente con fines de agrupación y
clasificación en función de la probabilidad condicional de
que ocurra algo.
SVM transductiva
Las máquinas vectoriales de soporte transductivas (TSVM)
se han utilizado ampliamente como medio para tratar datos
parcialmente etiquetados en el aprendizaje semisupervisado.
A su alrededor, ha habido misterio por la falta de
comprensión de su fundamento en la generalización. Se
utiliza para etiquetar los datos no etiquetados de forma que
el margen sea máximo entre los datos etiquetados y los no
etiquetados. Encontrar una solución exacta mediante TSVM
es un problema de dificultad NP.
Modelos generativos
Un modelo generativo es el que puede generar datos.
Modela tanto las características como la clase (es decir, los
datos completos). Si modelizamos P(x,y): Puedo utilizar esta
distribución de probabilidad para generar puntos de datos,
por lo que todos los algoritmos que modelizan P(x,y) son
generativos. Un ejemplo etiquetado por componente es
suficiente para confirmar la distribución de la mezcla.
Autoformación
En el autoentrenamiento, un clasificador se entrena con una
porción de datos etiquetados. A continuación, el clasificador
se alimenta con datos sin etiquetar. Los puntos no
etiquetados y las etiquetas predichas se suman en el conjunto
de entrenamiento. Este procedimiento se repite una vez más.
El clasificador aprende por sí mismo, de ahí el nombre de
autoformación.
Aprendizaje multitarea
Impulso:
El término "Boosting" hace referencia a una familia de
algoritmos que convierte los aprendices débiles en
aprendices fuertes. El refuerzo es una técnica de
aprendizaje por conjuntos que se utiliza para reducir el
sesgo y la varianza. Boosting se basa en la pregunta
planteada por Kearns y Valiant "¿Puede un conjunto de
aprendices débiles crear un único aprendiz fuerte?".
Un aprendiz débil se define como un clasificador, un
aprendiz fuerte es un clasificador que está arbitrariamente
bien correlacionado con la clasificación verdadera.
Embolsado
El ensacado o agregación bootstrap se aplica cuando es
necesario aumentar la precisión y la estabilidad de un
algoritmo de aprendizaje automático. Se aplica en
clasificación y regresión. El ensacado también reduce la
varianza y ayuda a gestionar el sobreajuste.
Redes neuronales
Una red neuronal es una serie de algoritmos que tratan de
reconocer las relaciones subyacentes en un conjunto de datos Figura: Red neuronal no supervisada
mediante un proceso que imita el funcionamiento del
cerebro humano. En este sentido, las redes neuronales se Red neuronal reforzada
refieren a sistemas de neuronas, ya sean de naturaleza El aprendizaje por refuerzo se refiere a los algoritmos
orgánica o artificial. Las redes neuronales pueden adaptarse orientados a objetivos, que aprenden a alcanzar un objetivo
a entradas cambiantes, de modo que la red genera el mejor complejo (meta) o a maximizar a lo largo de una dimensión
resultado posible sin necesidad de rediseñar los criterios de concreta a lo largo de muchos pasos; por ejemplo,
salida. El concepto de redes neuronales, que tiene sus raíces maximizar los puntos ganados en un juego a lo largo de
en la inteligencia artificial, está ganando popularidad muchas jugadas. Pueden partir de una pizarra en blanco y, en
rápidamente en el desarrollo de sistemas de negociación. las condiciones adecuadas, alcanzar un rendimiento
sobrehumano. Al igual que un niño incentivado con azotes y
caramelos, estos algoritmos son penalizados cuando toman
decisiones equivocadas y recompensados cuando toman las
correctas: esto es el refuerzo.
2. Conclusión
El aprendizaje automático puede ser supervisado o no
supervisado. Si dispone de menos datos y de datos
claramente etiquetados para el entrenamiento, opte por el
aprendizaje supervisado. El aprendizaje no supervisado suele
dar mejores resultados para grandes conjuntos de datos. Si
dispone de un gran conjunto de datos, opte por las técnicas
de aprendizaje profundo. También has aprendido
Aprendizaje por Refuerzo y Aprendizaje Profundo por
Refuerzo. Ahora ya sabe qué son las redes neuronales, sus
aplicaciones y sus limitaciones. Este artículo analiza varios
algoritmos de aprendizaje automático. Hoy en día, todas y
cada una de las personas utilizan el aprendizaje automático a
sabiendas o sin saberlo. Desde obtener un producto
recomendado en una compra en línea hasta actualizar fotos
en las redes sociales. Este artículo ofrece una introducción a
los algoritmos de aprendizaje automático más populares.
Referencias
[1] W. Richert, L. P. Coelho, "Building Machine Learning
Systems with Python", Packt Publishing Ltd., ISBN
978-1-78216-140-0
[2] J. M. Keller, M. R. Gray, J. A. Givens Jr., "A Fuzzy K-
Nearest Neighbor Algorithm", IEEE Transactions on
Systems, Man and Cybernetics, Vol. SMC-15, No. 4,
Agosto de 1985
[3] https://www.geeksforgeeks.org/machine-learning/
[4] ] S. Marsland, Aprendizaje automático: una perspectiva
algorítmica. CRC press, 2015.
[5] M. Bkassiny, Y. Li y S. K. Jayaweera, "A survey on
machine learning techniques in cognitive radios", IEEE
Communications Surveys & Tutorials, vol. 15, no. 3,
pp. 1136-1159, oct. 2012.
[6] https://en.wikipedia.org/wiki/Instance-based_learning
[7] R. S. Sutton, "Introducción: The Challenge of
Reinforcement Learning", Machine Learning, 8, páginas
225-227, Kluwer Academic Publishers, Boston, 1992.
[8] P. Harrington, "Machine Learning in action", Manning
Publications Co., Shelter Island, Nueva York, 2012.