GRUPO 6 PAF MachineLearning

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 35

FACULTAD DE INGENIERÍA, ARQUITECTURA Y URBANISMO

ESCUELA DE INGENIERIA DE SISTEMAS

CLASIFICACIÓN AUTOMÁTICA DE CALIDAD DE


AUTOMÓVILES UTILIZANDO MACHINE LEARNING

INTENGRANTES:

Docente:

Asignatura:
MACHINE LEARNING

CICLO:
VI

2021 – Perú
RESUMEN

En el presente trabajo describe como a través del machine learning se puede analizar
si un automóvil es accesible o no a raíz de sus características, como una forma de
ayudar al comprador o conductor de autos ya que estos se basan usualmente en el
precio, la seguridad o lo espacioso que es el coche.

Machine learning ha desarrollado técnicas con la computación como base que


permiten a las máquinas aprender. Su tecnología permite, por ejemplo, que un sistema
identifique millones de patrones para ir incorporando nuevos conocimientos que le
permite a la maquina reaccionar en múltiples situaciones, casos o procesos futuros. Su
constante evolución hace que el sistema vaya perfeccionando su comportamiento de
forma muy autónoma, y logre un nivel de eficiencia óptimo.

El data set elegido tiene un conjunto de datos de evaluación de coches los cuales el
grupo consideró eficientes para la realización del presente trabajo. La página web que
contiene la data set se denomina UC Irvine Machine Learning Repository, un
repositorio con una amplia cantidad de bases de datos.

El trabajo está estructurado de tal forma que se presenta la introducción la cual incluye
el caso de estudio donde se describen los pasos con los cuales se seleccionó, su
utilidad y la contribución a la sociedad que este brinda, seguidamente del contexto del
proyecto donde se describe el caso seleccionado, asimismo se presentan los
resultados los cuales cuentan con la identificación de atributos, la identificación de
etiquetas de clasificación y regresión para en entrenamiento y prueba del dataset.
Finalmente, se presenta la implementación de un programa con interfaz gráfica
realizado en Java donde se vincula con Weka para realizar el aprendizaje de máquina
de acuerdo a los diferentes clasificadores para obtener los mejores resultados y
métricas.
INTRODUCCIÓN
En la actualidad diferentes sectores están trabajando con machine learning
como por ejemplo el informático, corporativo, salud, transporte, entre otros. Se ha
encontrado la solución a la tarea de aprendizaje y predicción en esta disciplina
procedente de la inteligencia artificial. Roman (2019) lo define como “la ciencia que
permite que las computadoras aprendan y actúen como lo hacen los humanos,
mejorando su aprendizaje a lo largo del tiempo de una forma autónoma,
alimentándolas con datos e información en forma de observaciones e interacciones
con el mundo real.” Es una herramienta que captura la información (Big data) con el
objetivo de mejorar el análisis de datos y rendimiento de modelos predictivos,
realizando una predicción futura a través de la implementación de nuevos sistemas o
mejorando los ya existentes.

Respecto a la definición de lo que es una big data, cito lo dicho por la Institución
Universitaria Esumer quien refiere “El big data se ha definido como un activo de
información de alto volumen, alta velocidad y alta variedad, que exigen formas
rentables e innovadoras de procesamiento de la información para una visión mejorada
y la toma de decisiones” Por lo tanto, el Big Data consiste en un proceso que analiza e
interpreta grandes volúmenes de datos, tanto estructurados como no estructurados.

En el presente trabajo se utilizará el data set de un conjunto de datos de evaluación de


coches, los cuales forman parte esencialmente de nuestra vida cotidiana. Hay
diferentes tipos de coches producidos por diferentes fabricantes, por lo que el
comprador tiene que elegir. La elección de los compradores o conductores depende
sobre todo del precio, la seguridad y lo lujoso o espacioso que sea el coche. La base
de datos de evaluación de coches contiene ejemplos con la información estructural, es
decir, relaciona directamente el coche con los seis atributos de entrada: compra,
mantenimiento, puertas, personas, maletero y seguridad. Debido a la estructura
conceptual subyacente, esta base de datos puede ser especialmente útil para probar
la inducción constructiva y los de descubrimiento de estructuras.

 Caso de Estudio
La evolución de la creación de autos ha sido muy demandante para la
sociedad, ya que muchas personas optan para la compra de autos para que
puedan transportarse. Según Pérez (2016), nos menciona que “en la actualidad
existe una gran variedad de automóviles, por lo cual, el usuario pueda elegir
aquel que mejor le sea agradable y adaptable para su gusto.”

Toda persona para que pueda realizar su compra de un determinado auto que
se adapte a su gusto, necesita saber si puede ser accesible, el peso que puede
soportar, el lujo del carro, entre otros; hace que necesite conocer de todo tipo
de carro que le brindan las industrias que exportan dichos automóviles.

La inteligencia artificial que actualmente está mejorando a la sociedad, está


tomando un rol importante, el cual encontramos dentro de esta rama lo que es
machine learning o también conocido como “aprendizaje automático”, el cual
nos permite que podamos implementar algoritmos a las computadoras para
que puedan aprenderlas y colaborar en la sociedad. Según Hinestroza (2018),
nos dice que “machine learning se basa en una sola meta, la cual es poder
lograr el aprendizaje autónomo de las máquinas y dar apoyo a la sociedad.”

Para seleccionar el caso de estudio para esta investigación, se acudió a


repositorios de machine learning el cual se encontró aportes de diferentes
autores que brindan sus dataset e información de dicho tema a buscar. El
repositorio en el cual se acudió para poder escoger la data set y realizar dicha
investigación es el repositorio UCI Machine learning.

El repositorio UCI Machine learning perteneciente a la Universidad California,


obtiene una colección de base de datos y dataset usados por la sociedad para
poder realizar un análisis de algoritmos de Machine learning. Actualmente
consta con 450 conjuntos de dataset para el uso por parte de la comunidad.
(UOC, 2015)

Se tomó varias revisiones a los documentos que se muestran en las dataset de


UCI Machine learning, en la cual se ha tomado el conjunto de datos de
evolución del coche para el tema de investigación, permitiendo poder realizar la
clasificación de calidad de un auto utilizando Machine learning, por el ingreso
de datos.

La utilidad del caso seleccionado que se dará a través de Machine Learning, es


poder brindar a las personas la calidad de un auto para su compra, donde se le
podrá brindar que tan cómodo es, su capacidad, entro otros atributos;
permitiendo que, al ingresar dichos datos, se pueda brindar una respuesta
como clasificación de calidad al auto para el usuario, para que así pueda
verificar si ese accesible o inaccesible y decida comprarlo o no.
La investigación contribuye en la sociedad como apoyo a las personas, para
que puedan comprobar que el auto que se comprará es de su agrado y si
cumplen con sus expectativas.

 Contexto del Proyecto

El trabajar con Inteligencia Artificial, no es un tema novedoso, pues


gracias a este medio se han desarrollado muchos métodos, los cuales tienen
como principal función lograr la solución de tareas de manera más rápida y
eficiente, como menciona Maisueche (2019), “La Inteligencia Artificial, es la
habilidad que tienen las computadoras, con la finalidad de simular las
capacidades humanas, mediante prueba y error”. Es decir, para implementar
este método ágil, es de gran utilidad tener patrones que brinden una base, de
la cual esta se va a guiar para realizar o categorizar la función que se le asigne.

Actualmente, los algoritmos de aprendizaje de máquina y la minería de


datos participan en múltiples aplicaciones como en las industrias y
principalmente en los automóviles, con aplicaciones para determinar la calidad
de los autos a través de sus características, es por ello que hoy en día, los
datos tienen un papel importante ya que se necesita una disponibilidad máxima
para determinar su eficiencia e identificar los datos disponibles en base a su
calidad (Hinestroza, 2018).

Las industrias de autos cada vez necesitan ofrecer productos de alta


calidad con el mínimo coste, es por ello que están implementando el
aprendizaje automático mediante la facilidad de obtención y almacenamiento
de datos para la mejora de la eficiencia en la calidad de productos y brindando
un buen servicio a sus clientes (Maisueche, 2019).

Por lo tanto, la calidad y el modelo de los autos se van ajustando de acuerdo a


los resultados de machine learning, ya que, con gran cantidad de información,
es conveniente aportar nuevos enfoques muy útiles, también se consiguen
optimizar los flujos de producción y de transporte, así como focalizar la
atención en el cliente para responder rápido ante los cambios en el mercado
(Lázaro, 2018). Motivo por el que, al tener, una inteligencia artificial que pueda
catar, la calidad de los vehículos se necesita poner algunos principios o datos
base, con la finalidad de que estos sirvan como una referencia, pues García
(2018), indican que: “Para realizar el test de calidad de los vehículos, se debe
tener en cuenta las partes o diversas dimensionas por las que se compone
este, como también el rendimiento o algunos datos según lo que desee
estimar”.

En esta oportunidad, se ha considerado trabajar con dataset de modo


CSV, el cual tenga datos base para poder estimar cuan es la calidad y
estimación de los vehículos, pues este elemento fundamental en inteligencia
artificial, Pérez (2017), lo define como: “Conjunto de datos, generalmente
ordenados de manera tabulada; cuenta solamente con datos específicos los
cuales sirven o estiman atributos de un objeto”.

El dataset seleccionado está definido para conocer la comodidad desde


el año 1997 hasta el 2020 de la evaluación de los automóviles.

Está compuesta por 6 filas que contienen toda la información precisa de


la comodidad, a través de sus características que se necesitan saber para
entrenar el aprendizaje automático.

Figura 1: Automóvil
Fuente: https://archive.ics.uci.edu/ml/assets/MLimages/Large19.jpg

Descripción de los atributos

- Precio: Precio de compra de auto


- Mantenimiento: Precio de mantenimiento
- Puertas: Numero de puertas que puede tener el auto
- Personas: Capacidad en de personas a transportar de acuerdo a los
asientos
- Maletera: Tamaño de la maletera para en transporte de objetos
- Seguridad: Seguridad que tiene el auto
RESULTADOS
 Identificación de atributos

Nombre del Descripción ¿Cómo Posibles Descripción Tipo de


atributo del atributo contribuye valores del posible variable
¿Qué a valor
representa? identificar
la etiqueta?
Representa lo Ayuda a Muy alto
Compra niveles del estimar un Alto Nivel de Discreta
precio del auto valor de Medio compra
compra Bajo
Escala de Ayuda a Muy alto Nivel de
mantenimiento identificar Alto eficiencia, Discreta
Mantenimiento del auto el estado Medio medida por el
del auto Bajo mantenimiento

Número de Ayuda a Cantidad de


N° de Puertas puertas que identificar Número puertas por Continua
puede tener el la cantidad entero auto
auto de puertas

Conocer la Número Cantidad de Continua


N° de personas Capacidad del capacidad entero personas por
que puede vehículo de personas auto
transportar que soporta
el vehículo
Conocer la Grande Discreta
Tamaño de Según el capacidad Mediano Tamaño de la
maletera tamaño de objetos Pequeño maletera del
que soporta auto
el vehículo
Ayuda a Alta Niveles de Discreta
Seguridad Que tan seguro determinar Media seguridad
estimada es el auto qué tan Baja
seguro es el
vehículo
 Identificando las etiquetas de clasificación/regresión/clustering

Nombre de la etiqueta Clase (posibles valores) Descripción de la clase


No cumple con expectativas
Inaccesible del cliente, para realizar la
compra del auto
Accesible Cumple con algunos
atributos del auto
Calidad del auto Cumple con gran parte de
Bueno los atributos, pero no en su
totalidad
Cumple con todos los
Muy bueno atributos que requiere el
cliente

 Transformación de atributos y etiquetas


Para la transformación de los atributos de nuestra dataset, se aplicará filtros
para poder realizar las transformaciones y así obtener buenos resultados, ya
que Weka brinda la facilidad de aplicar una gran variedad de filtros sobre los
datos, teniendo 2 tipos, los supervisados y no supervisados, por lo cual, en el
presente trabajo se utilizarán los filtros no supervisados.

Figura 2: Filtros no supervisados de Weka


Elaboración: Propia
1. buying, maint, doors, persons, lug_boot, safety, acceptability
1.1. Análisis
Tipo de Datos:
Nominal (buying, maint, lug_boot, safety, acceptability)
String (doors, persons)

1.2.

Operaciones de transformación a realizar


Para la transformación de datos en la dataset, se utilizará el filtro
RenameAttribute, el cual nos permitirá poder cambiar los nombres de
los atributos.

1.3. Transformación
1. Seleccionamos el filtro a usar (RenameAttribute)
2. Damos clic en el atributo, y configuramos sus características de
dicho filtro.

3. Antes de aplicar el filtro con los nuevos datos, verificamos como está
actualmente la dataset.

4. Ahora se procede a colocar los datos nuevos. Colocamos “1” en


attributeindices que hace referencia
al número de filas, en este caso se
hará para las 6 filas restantes
también, en fin, se coloca el nombre
del atributo a reemplazar, siendo el
primero “buying” y en replace, el
cual es con que nombre se
reemplazará será “Compra”, esto se
hará igualmente con los atributos
restantes.
5. Se obtiene el siguiente resultado al aplicar el filtro RenameAttribute.
2. Doors “numeroPuertas”, persons “capacidadPersonas”
2.1. Análisis
Tipo de Datos: String

2.2. Operaciones de transformación a realizar


Como los atributos numeroPuertas y capacidadPersonas se encuentran
como dato String, Weka no puede mostrar los valores de manera gráfica
y no se puede realizar el análisis para una correcta predicción, por
ende, se utilizará el filtro StringToNominal para la transformación de
dichos datos la cual nos permitirá poder cambiar un atributo de tipo
cadena a tipo nominal.

2.3. Transformación
1. Seleccionamos el filtro a usar (StringToNominal)

2. Damos clic
en el atributo, y configuramos sus características de dicho filtro.

3. Antes de aplicar el filtro con los nuevos datos, verificamos como está
actualmente la dataset.
numeroPuertas
capacidadPersonas

4.

Ahora se procede a colocar los datos, de acuerdo a la posición de los


atributos que son string y se
encuentran en la fila 3 y 4.
Colocamos “3,4” en
attributeRange que hace
referencia al número de filas, en este caso se hará solo para las filas
antes mencionadas, y se aplica dicho filtro.
5. Se obtiene el siguiente resultado al aplicar el filtro RenameAttribute.
numeroPuertas

capacidadPersonas
Al aplicar el filtro StringToNominal, ha permitido mostrar los
atributos que anteriormente estaban convertidos en cadena y no se
podían visualizar, recordemos que Weka solo muestra los atributos
que sean de tipo numérico y nominal.

 Preparación de datasets de entrenamiento, prueba y validación.

La imagen muestra datos del dataset que son en total 1728, en el cual se tiene
7 atributos, esta ha sido implementada con filtros ya mencionados, lo cual se
tiene que dividir al azar los ejemplos y de esta manera obtener el dataset de
entrenamiento, prueba y validación (donde se puede trabajar la proporción 60,
20, 20).
Primeramente, se tiene los datos sin trabajar y de manera ordenada según el
dataset en el que se ha decidido trabajar.

Randomize: Este filtro permite mezclar aleatoriamente el orden de las


instancias.
En esta imagen muestra los datos ya combinados en el dataset, con los cuales
se va a trabajar posteriormente

Total, de datos con los cuales se va a trabajar para obtener nuestras muestras.
Se aplica el filtro RemovePercentage, la cual tiene como función remover el
40% del dataset, lo cual demostrará que podemos con el 60% de datos que
servirá para el entrenamiento.

Después de haber aplicado el filtro se tiene el 60% de los datos los cuales
serán usados en el entrenamiento, con un total de 1037
Posteriormente se activa en true la opción de inverSelect, donde invierte a los
ejemplos que ya han sido seleccionados en primera instancia y muestra los
datos restantes.

Al haber seleccionado la opción de invertSlectión en modo true, se puede


apreciar el porcentaje de los datos removidos anteriormente, de lo cual se tiene
691 ejemplos.

Con el filtro RemovePercentage podemos dividimos la dataset en dos partes


iguales en la que la primera pueda corresponder a la prueba.
Los 345 ejemplos corresponden al 20% de datos que sirve para la prueba, del
total de 1728

Cambiamos a true el inverSelect, para poder obtener el 20% de datos que


fueron removidos y así usarlo para la validación.

En esta parte se ha logrado obtener un 20% del total de datos, los cuales van a
servir para la validación.
Comparación de las tres dataset, el primero que representa el entrenamiento,
el segundo la prueba y el final la validación con la que se trabaja.
 Programa para entrenamiento y prueba.

Para la construcción del programa con interfaz gráfica (GUI) se ha optado en


utilizar NetBeans que es un IDE de Java, la cual tiene múltiples
funcionalidades, permitiendo que la construcción de programa sea más
eficiente y fácil de utilizar, asimismo en dicho programa se ha incorporado la
librería “WEKA.JAR” que facilita tener los resultados de forma fácil como si se
obtuviera los datos desde el mismo programa de WEKA. Este programa va
permite ejecutar el entrenamiento y prueba del DataSet, previamente validado
de acuerdo a las prioridades de los atributos y etiquetas. Por lo tanto, dicho
programa va clasificar de manera automática la calidad de autos utilizando
técnicas de aprendizaje aprendidos en clase como los clasificadores
(Regresión Logística, Red Neuronal, SVM, Bayesiano y Árbol de decisión)
donde cada una de ellas cuenta con variantes y/o funciones que muestran las
métricas de evaluación de los clasificadores previamente mencionados.
De tal manera, se presentan las siguientes interfaces gráficas realizadas en
NetBeans, donde se tiene dos interfaces, la principal que muestra el tema a
tratar y la segunda es donde se va realizar los clasificadores seleccionados.
Figura 3: Primera interfaz desarrollada en JAVA
Fuente: Elaboración Propia

Figura 4: Interfaz donde se va a procesar los datos del dataset


Fuente: Elaboración Propia
 Comparación de resultados

REGRESIÓN LOGÍSTICA

Tabla 1: Resultados del clasificador de Regresión Logística.

Total,
Total, tiempo
Algoritmo uso de Exactitud Precisión Recall F-Measure AUC
de ejecución
CPU
Regresión
10% 1.98 s 94.79 0.97 0.955 0.96 0.99
Logística
447.0 - 19.0 - 2.0 - 0.0 -
Matriz de 15.0 - 141.0 - 3.0 - 9.0 -
confusión 0.0 - 2.0 - 22.0 - 3.0 -
0.0 - 9.0 - 1.0 - 18.0 -

Fuente: Elaboración propia


RED NEURONAL

Total,
Tasa de Total, tiempo
Algoritmo Función Tamaño uso de Exactitud Precisión Recall F-Measure AUC
aprendizaje de ejecución
CPU
Red neuronal
0.1 - [5,3] 20% 4.27 s 625.0 0.993 0.982 0.988 0.987
1
Red neuronal
1 - [3,4,2] 35% 4.84 s 619.0 0.987 0.97 0.98 0.986
2
Red neuronal
0.001 - [2,2] 15% 3.99 s 601.0 0.97 0.96 0.96 0.988
3

460.0 - 8.0 - 0.0 - 0.0 - 456.0 - 12.0 - 0.0 - 0.0 - 448.0 - 20.0 - 0.0 - 0.0 -
Matriz de 3.0 - 165.0 - 0.0 - 0.0 - 5.0 - 163.0 - 0.0 - 0.0 - 15.0 - 153.0 - 0.0 - 0.0 -
confusión 0.0 - 27.0 - 0.0 - 0.0 - 1.0 - 26.0 - 0.0 - 0.0 - 0.0 - 27.0 - 0.0 - 0.0 -
0.0 - 28.0 - 0.0 - 0.0 - 0.0 - 28.0 - 0.0 - 0.0 - 0.0 - 28.0 - 0.0 - 0.0 -

Tabla 2: Resultados del clasificador de Red Neuronal.

Fuente: Elaboración propia

SVM
Tabla 3: Resultados del clasificador SVM.

Total, Total,
Algoritmo Kernel uso de tiempo de Exactitud Precisión Recall F-Measure AUC
CPU ejecución

SVM Radial 45% 1.39 s 491.0 0.73 1.0 0.84 0.61


SVM Polinomial 26% 0.70 s 626.0 0.97 0.95 0.96 0.96

SVM Normalizado Polinomial 30 % 0.91 s 617.0 0.99 0.92 0.95 0.96

PUK (The Pearson VII


SVM function-based universal 52% 2.90 s 558.0 0.85 0.997 0.92 0.81
kernel)

468.0 - 0.0 - 0.0 - 0.0 - 444.0 - 23.0 - 0.0 - 1.0 - 431.0 - 37.0 - 0.0 - 0.0 -
145.0 - 23.0 - 0.0 - 0.0 - 11.0 - 147.0 - 1.0 - 9.0 - 4.0 - 160.0 - 1.0 - 3.0 -
6.0 - 21.0 - 0.0 - 0.0 - 0.0 - 5.0 - 22.0 - 0.0 - 0.0 - 6.0 - 21.0 - 0.0 -
24.0 - 4.0 - 0.0 - 0.0 - 0.0 - 14.0 - 1.0 - 13.0 - 0.0 - 20.0 - 3.0 - 5.0 -
Matriz de
confusión
467.0 - 1.0 - 0.0 - 0.0 -
77.0 - 91.0 - 0.0 - 0.0 -
3.0 - 24.0 - 0.0 - 0.0 -
2.0 - 26.0 - 0.0 - 0.0 -

Fuente: Elaboración propia

BAYESIANO
Tabla 4: Resultados del clasificador Bayesiano.

Total, uso Total, tiempo


Algoritmo Descripción Exactitud Precisión Recall F-Measure AUC
de CPU de ejecución

Para este
Naive Bayes algoritmo se utilizó 13% 0.017 s 89.29 0.92 0.91 0.92 0.97
un K-fold de 10

Para este
BayesNet algoritmo se utilizó 25% 0.54 s 89.0 0.92 0.91 0.92 0.97
un K-fold de 30
429.0 - 39.0 - 0.0 - 0.0 - 428.0 - 40.0 - 0.0 - 0.0 -
Matriz de 35.0 - 129.0 - 0.0 - 4.0 - 36.0 - 126.0 - 0.0 - 6.0 -
confusión 0.0 - 16.0 - 11.0 - 0.0 - 0.0 - 10.0 - 17.0 - 0.0 -
0.0 - 23.0 - 1.0 - 4.0 - 0.0 - 23.0 - 1.0 - 4.0 -

Fuente: Elaboración propia

ÁRBOL DE DECISIÓN
Tabla 5: Resultados del clasificador de Árbol de Decisión.

Total,
Total, tiempo
Algoritmo Descripción uso de Exactitud Precisión Recall F-Measure AUC
de ejecución
CPU

Para este
algoritmo se
RandomForest 25% 0.46 s 95.66 0.97 0.96 0.97 0.99
utilizó un K-fold
de 10
Para este
algoritmo se
J48 9% 0.08 s 91.03 0.94 0.92 0.93 0.96
utilizó un K-fold
de 10
451.0 - 16.0 - 1.0 - 0.0 - 431.0 - 34.0 - 2.0 - 1.0 -
Matriz de 13.0 - 147.0 - 2.0 - 6.0 - 23.0 - 134.0 - 7.0 - 4.0 -
confusión 0.0 - 3.0 - 22.0 - 2.0 - 2.0 - 6.0 - 16.0 - 3.0 -
0.0 - 13.0 - 2.0 - 13.0 - 0.0 - 19.0 - 3.0 - 6.0 -

Fuente: Elaboración propia

Finalmente, se muestran los mejores resultados de los clasificadores realizados anteriormente, es decir se muestran los mejores desempeños
en base al aprendizaje automático, donde se obtuvo lo siguiente:
Tabla 6: Resumen de los mejores resultados de los clasificadores.

Total,
uso Total, tiempo
Algoritmo Descripción Exactitud Precisión Recall F-Measure AUC
de de ejecución
CPU

Regresión El mejor resultado del


10% 1.98 s 94.79 0.97 0.955 0.96 0.99
Logística algoritmo es el siguiente
El mejor resultado es del
Red Neuronal primer algoritmo que tiene 2 20% 4.27 s 625.0 0.993 0.982 0.988 0.987
capas
El mejor resultado kernel, es el
SVM 26% 0.70 s 626.0 0.97 0.95 0.96 0.96
algoritmo SVM polinomial
El mejor resultado es el
Bayesiano 13% 0.017 s 89.29 0.92 0.91 0.92 0.97
algoritmo Naive Vayes
Árbol de El mejor resultado es el
25% 0.46 s 95.66 0.97 0.96 0.97 0.99
Decisión presentado por RandomForest

Fuente: Elaboración Propia


Exactitud y precisión de los algoritmos
0.97 0.993 0.97 0.92
Exactitud Precisión 0.97
0.9479 0.9566
0.8929
0.625 0.626

Precisión
Exactitud
ca al M no i ón
sti ron SV ia cis
gí eu es
Lo N ay De
n d B de
e s ió Re bol
gr Ár
Re

Figura 5: Gráfico comparativo de Exactitud y Precisión de los Algoritmos


Fuente: Elaboración Propia

Variantes del resumen de Clasificadores


1
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
Regresión Logís- Red Neuronal SVM Bayesiano Árbol de Decisión
tica

Exactitud Precisión Recall F-Measure

Figura 6: Gráfico comparativo de Variantes del resumen de Clasificadores


Fuente: Elaboración Propia
Área bajo la curva de los clasificadores

0.99
0.985
0.98
0.975
0.97
0.965
0.96
0.955
0.95
0.945
Regresión Red Neuronal SVM Bayesiano Árbol de
Logística Decisión

Figura 7: Gráfico comparativo de Área bajo la curva de los Clasificadores


Fuente: Elaboración Propia

Total de tiempo de ejecución de los Algoritmos

4.5
4
3.5
3
2.5
2
1.5
1
0.5
0
Regresión Red Neuronal SVM Bayesiano Árbol de
Logística Decisión

Figura 8: Gráfico comparativo del tiempo total de ejecución de los Algoritmos


Fuente: Elaboración Propia
Total de uso de CPU

30%

25%

20%

15%

10%

5%

0%
Regresión Red Neuronal SVM Bayesiano Árbol de
Logística Decisión

Figura 9: Gráfico comparativo del uso total del CPU de los Algoritmos
Fuente: Elaboración Propia
CONCLUSIONES

- El software Weka nos permite aplicar una gran variedad de filtros sobre los
datos de nuestra dataset, lo cual nos brinda la capacidad de realizar cualquier
tipo de transformación sobre ellos, desde cambiar el valor o nombre de un
atributo hasta ordenarlos según un criterio determinado.

- La inteligencia artificial está siendo importante para las industrias, el cual esta
rama de la IA, es importante para dar aprendizaje automático a las
computadoras y pueda apoyar a las personas en su labor.

- A través de la implementación de Interfaz Gráfica se ha podido identificar de


manera más sencilla las métricas de diferentes clasificadores en base a sus
funciones o variantes.

- Todas las funcionalidades disponibles en los distintos interfaces gráficas (GUI)


de WEKA pueden ser usadas desde el código Java, ya que, al ser un software
de código abierto existe mucha documentación con la cual guiarse.
REFERENCIAS

García, J. (2018). Telcel. Obtenido de IA, en la industria automotriz:


https://www.telcel.com/em

BIBLIOGRAPHYHinestroza, D. (2018). EL MACHINE LEARNING A TRAVÉS DE LOS TIEMPOS, Y LOS


APORTES A LA HUMANIDAD. Obtenido de
https://repository.unilibre.edu.co/bitstream/handle/10901/17289/EL%20MACHINE
%20LEARNING.pdf?sequence=1&isAllowed=y#:~:text=Machine%20Learning%20es
%20un%20%C3%A1rea,para%20que%20las%20computadoras
%20aprendan.&text=Camino%20hacia%20la%20sociedad%20de%20la%2

Institución Universitaria Esumer (2018). Big data y los nuevos manejos de información.
Extraído de http://repositorio.esumer.edu.co/bitstream/esumer/1905/1/BIG
%20DATA.pdf

Lázaro, A. (20189. Machine Learning en la industria del automóvil. Obtenido de


Universidad de Alcalá
https://ebuah.uah.es/dspace/bitstream/handle/10017/33979/TFG_Lazaro_Engui
ta_2018.pdf?sequence=1&isAllowed=y

Maisueche, A. (2019). UTILIZACIÓN DEL MACHINE LEARNING EN LA INDUSTRIA


4.0. España. Obtenido de https://core.ac.uk/download/pdf/228074134.pdf

Pérez, A. (2016). Tipos de Automóviles . Obtenido de


https://www3.gobiernodecanarias.org/medusa/ecoblog/malcval/files/2014/05/
VEHiCULOS-AUTOMoVILES.pdf

Peréz, M. (2017). La Gestión de Datos de Investigación. España. Obtenido de


https://repositorio.uam.es/bitstream/handle/10486/678601/gestion_perez_us_2
017_2.pdf?sequence=2

Roman, V. (2019). Introducción al Machine Learning: Una Guía Desde Cero. Extraído
de https://medium.com/datos-y-ciencia/introduccion-al-machine-learning-una-
gu%C3%ADa-desde-cero-b696a2ead359

UOC. (2015). Espacio de recursos de ciencia de datos. Obtenido de


http://datascience.recursos.uoc.edu/es/repositorio-uci-ml/
ANEXOS

Figura 11: Repositorio Machine Learning – dataset de evaluación


del coche
Fuente: https://archive.ics.uci.edu/ml/datasets/Car+Evaluation

También podría gustarte