Proyecto de Tesis

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 16

FACULTAD DE INGENIERÍA Y ARQUITECTURA

ESCUELA PROFESIONAL DE INGENIERÍA DE SISTEMAS

PROYECTO DE TESIS

MACHINE LEARNING PARA PREDECIR EL RIESGO CREDITICIO USANDO EL


MODELO LOGIT EN LA EMPRESA GRUPO TOVAR SAC.

AUTORES
EDWARD ALFONSO CASAVERDE CAMASITA
ORCID: 0000-0001-7668-7118

PAULINO LÓPEZ YUCRA


ORCID: 0000-0003-1413-7756

ASESOR
ORLANDO CLEMENTE IPARRAGUIRRE VILLANUEVA
ORCID: 0000-0000-0000-0000

LÍNEA DE INVESTIGACIÓN
SISTEMAS INTELIGENTES

LIMA, PERÚ, DICIEMBRE DE 2023


DECLARACIÓN DE ORIGINALIDAD

Yo Edward Alfonso Casaverde Camasita, con DNI Nº xxxxxx autor del proyecto de
tesis que lleva por título:

MACHINE LEARNING PARA PREDECIR EL RIESGO CREDITICIO USANDO EL


MODELO LOGIT EN LA EMPRESA GRUPO TOVAR SAC.

DECLARO, que este proyecto de tesis es elaborada por mi autoría y es una obra
original el cual ha sido sometida a un proceso de comparación por el software
antiplagio Turnitin considerando lo señalado en la GUÍA PARA SALVAGUARDAR
LA PROPIEDAD INTELECTUAL EN LA UNIVERSIDAD AUTÓNOMA DEL PERÚ.

ASUMO LA RESPONSABILIDAD de cualquier indicio de plagio y soy consciente


que este compromiso de originalidad de mi proyecto de tesis tiene connotaciones
académicas y éticas. A su vez indico que no estoy infringiendo la propiedad
intelectual y los derechos de otros autores, ya que el trabajo presentado se
encuentra debidamente citado y referenciado por mi persona.

2
DECLARACIÓN DE ORIGINALIDAD

Yo Paulino López Yucra, con DNI Nº 46835644 autor del proyecto de tesis que lleva
por título:

MACHINE LEARNING PARA PREDECIR EL RIESGO CREDITICIO USANDO EL


MODELO LOGIT EN LA EMPRESA GRUPO TOVAR SAC.

DECLARO, que este proyecto de tesis es elaborada por mi autoría y es una obra
original el cual ha sido sometida a un proceso de comparación por el software
antiplagio Turnitin considerando lo señalado en la GUÍA PARA SALVAGUARDAR
LA PROPIEDAD INTELECTUAL EN LA UNIVERSIDAD AUTÓNOMA DEL PERÚ.

ASUMO LA RESPONSABILIDAD de cualquier indicio de plagio y soy consciente


que este compromiso de originalidad de mi proyecto de tesis tiene connotaciones
académicas y éticas. A su vez indico que no estoy infringiendo la propiedad
intelectual y los derechos de otros autores, ya que el trabajo presentado se
encuentra debidamente citado y referenciado por mi persona.
ÍNDICE

I. INTRODUCCIÓN
ll. METODOLOGÍA
2.1. Tipo y diseño de investigación
2.2. Población, muestra y muestreo (incluir criterios de selección)
2.3. Hipótesis
2.4. Variables y operacionalización
2.5. Técnicas e instrumentos de recolección de datos, validez y confiabilidad
2.6. Procedimientos
2.7. Análisis de datos
2.8. Aspectos éticos
III. ASPECTOS ADMINISTRATIVOS
3.1. Presupuesto y financiamiento
3.2. Cronograma de actividades
REFERENCIAS
ANEXOS

2
I. INTRODUCCIÓN

A nivel global, la economía cambia constantemente, lo que hace que las

empresas sean cada vez más complejas en sus operaciones. En particular, las

empresas del sector financiero que requieren una alta capacidad de prever y evaluar

a los clientes para evitar problemas futuros que puedan afectar a la empresa (Suh,

2023) .Contar con información adecuada es esencial al realizar predicciones. Por lo

tanto, las previsiones son esenciales para la planificación y la creación de modelos.

(Tofiq et al., 2022). Estas previsiones se pueden utilizar en diversos contextos para

comprender mejor el futuro de los datos finales (Kumar et al., 2023). En el ámbito de

la gestión de riesgos crediticios, la necesidad de realizar previsiones es de suma

importancia (Yang, 2023).

Actualmente, en el contexto nacional, las empresas están experimentando

tasas de morosidad entre sus clientes que superan notablemente el promedio en la

economía del país (BCRP, 2022). Por esta razón, se han adoptado diversas

tecnologías y métodos de predicción de clientes (Zohdi et al., 2022), con el objetivo

de reducir de manera efectiva el índice de la morosidad.

Las compañías están haciendo uso de la tecnología actual para continuar su

crecimiento económico (William, 2022). Los sistemas de información les brindan la

capacidad de automatizar los procesos dentro de la organización, y la adquisición

de soluciones informáticas les permite gestionar las operaciones crediticias en

diversas plataformas de trabajo (Orlova, 2020). Además, están incorporando

sistemas expertos que hacen uso de la Inteligencia Artificial (IA) en su entorno

empresarial (Chen & de Luca, 2021). Esta disciplina específica posibilita la

3
automatización de tareas intelectuales en múltiples contextos, como lo describe

(Russell & Norvig, 2017).

Los modelos predictivos que hacen uso de la IA tienen la capacidad de imitar

los procesos de adquisición de conocimiento y replicar el funcionamiento del cerebro

humano (Kidd & Hayden, 2015), a través de lo que se conoce como Redes

Neuronales Artificiales (ANN) (Hurwitz & Kirsch, 2018). Estos modelos se inspiran

en la estructura altamente interconectada de los sistemas nerviosos de seres vivos,

como animales y humanos (Arredondo, 2016).

A nivel local, la empresa GRUPO TOVAR S.A.C. Se destaca por ofrecer

productos de calidad en la venta de pinturas industriales. Esto ha habilitado a la

empresa para emplear tecnología de punta, como el ML, con el propósito de llevar a

cabo la predicción de riesgos crediticios, como se menciona en el contexto de

(Navarro & Ríos, 2015). Estos autores realizaron un estudio relacionado con el

desarrollo de una solución de Business Intelligence (BI), con el objetivo de

proporcionar un mejor respaldo para la toma de decisiones dentro de la empresa.

En GRUPO TOVAR S.A.C., está confrontando un problema fundamental

vinculado a la carencia de un método eficaz para validar la información actualizada

de los clientes durante el proceso de admisión de operaciones comerciales. Esto

pone en una situación de incertidumbre a la hora de tomar la decisión de aprobar o

rechazar dichas operaciones. Consecuentemente, la evaluación incorrecta de un

posible cliente podría acarrear repercusiones negativas que impactan en la solidez

financiera de la empresa.

Además, la determinación de conceder crédito a un cliente se ve influenciada

por el juicio subjetivo del comité encargado, lo que comúnmente se denomina como

4
sesgo cognitivo. En este contexto, es fundamental la integración de tecnologías

modernas como el ML. Este enfoque, que utiliza algoritmos predictivos, automatiza

la etapa de validación y permite el análisis, procesamiento y aprendizaje a partir de

los datos. La implementación de esta tecnología podría mejorar la toma de

decisiones y reduce los riesgos relacionados con la subjetividad humana en este

proceso crucial.

Por ello, se plantea el problema general ¿En qué medida ML permite predecir

el riesgo crediticio de un cliente en la empresa GRUPO TOVAR, 2023? Y como

problemas específicos, se tiene: (1) ¿En qué medida ML con el modelo Logit

permite predecir con precisión el riesgo crediticio de un cliente en la empresa

GRUPO TOVAR SAC, 2023?, (2) ¿En qué medida ML permite predecir con

especificidad el riesgo crediticio de un cliente en la empresa GRUPO TOVAR SAC,

2023?, (3) ¿En qué medida ML permite predecir con rapidez el riesgo crediticio de

un cliente en la empresa GRUPO TOVAR SAC, 2023?

La justificación científica de este tema radica en la necesidad de mejorar la

gestión del riesgo crediticio en la empresa GRUPO TOVAR SAC a través de la

aplicación de ML, lo que puede conducir a una toma de decisiones más precisa y

basada en datos, y contribuir al avance del conocimiento en el campo de las

finanzas y la IA. Institucionalmente, se justifica en la necesidad de que el GRUPO

TOVAR SAC de optimizar su gestión de riesgo crediticio, mejorar su competitividad

y tomar decisiones más fundamentadas al otorgar créditos. En lo social, se justifica

porque busca promover la educación financiera, mejorar la estabilidad financiera de

los hogares y contribuir al desarrollo económico local.

5
En esta investigación se planteó como objetivo general: Implementar ML

usando el modelo Logit para predecir el riesgo crediticio de los clientes en la

empresa GRUPO TOVAR SAC, 2023. Y como objetivos específicos se tiene: (1)

Determinar en qué porcentaje ML permite predecir con precisión el riesgo crediticio

de un cliente en la empresa GRUPO TOVAR SAC, 2023; (2) Determinar en qué

porcentaje ML permite predecir con especificidad el riesgo crediticio de un cliente en

la empresa GRUPO TOVAR SAC, 2023; (3) Determinar en qué porcentaje ML

permite predecir con rapidez el riesgo crediticio de un cliente en la empresa GRUPO

TOVAR SAC, 2023.

El presente trabajo de investigación se realizará durante el periodo

comprendido entre el mes de agosto de 2023 hasta diciembre de 2023. Asimismo,

se llevará a cabo en la empresa GRUPO TOVAR SAC. Y como delimitación

conceptual se usa el modelo Logit y la información recaudada de los clientes entre

el periodo 2020 y 2023.

A nivel internacional, como antecedentes se tiene la investigación de

(Wbeimar O & Veronica J., 2021) donde analizaron el modelo de Regresión

Logística (RL) y Random Forest (RF), para lo cual utilizaron una metodología de

comparación en la eficiencia de la estimación de los clientes que van a entrar en

mora, utilizando los modelos mencionados, y como resultado obtenido de la

investigación es que el modelo más equilibrado al momento de la evaluación es el

RF. Finalmente, concluyeron que el resultado obtenido indica que el modelo más

equilibrado al momento de la evaluación es el RF. También en la investigación de

(Luis L., 2022) utilizó varios algoritmos de ML, incluyendo RL, KNN, Decision Tree

Classifier, RF, Classifier y AutoML (con optimización bayesiana de

hiperparámetros), en lo cual utilizaron ciertos modelos con capacidad explicativa

6
para determinar las variables más influyentes en el riesgo de incumplimiento y

llegaron a concluir que de las numerosas variables iniciales, solo unas pocas son

realmente relevantes para predecir el riesgo de incumplimiento. (Alexander O.,

2021) implementó un modelo para estimar la probabilidad de default de la empresa

Tec Tec S.A., La metodología desarrollada es cuantitativa y complementa la

evaluación por segmento, determinando los fondos que la compañía está

arriesgando por segmento. Al aplicar el modelo de provisiones, se muestra que la

empresa debe reservar el 16,63% de su capital para hacer frente a provisiones por

riesgo de crédito, como resultado logran desarrollar una metodología cuantitativa

que complementa la evaluación por segmento y determina los fondos que la

compañía está arriesgando en cada segmento.

A nivel Nacional tenemos la investigación de (Yaranga V., 2022) que utilizó

modelos de ML para predecir el riesgo crediticio de los clientes de una empresa

peruana, menciona específicamente los algoritmos utilizados, que incluyen Support

Vector Machine, Random Forest, Naive Bayes, K Nearest Neighbor y Decision Tree,

La metodología aplicada en la investigación es la metodología KDD (Knowledge

Discovery in Databases), que es un enfoque integral para extraer información útil y

conocimiento de los datos, y obtiene como resultado que ML, en general, permite

predecir el riesgo crediticio de los clientes de la empresa en estudio. Además, se

destaca que el algoritmo con mejores resultados para esta casuística fue Support

Vector Machine, con una precisión del 99.8%. Por otro lado (Olive V., 2019) propone

la elaboración de un sistema predictivo inteligente basado en un modelo credit

scoring de aprendizaje automático, para ello utilizaría la metodología aplicada que

se basa en la fundamentación teórica y conceptualización de un modelo que refleja

el proceso funcional actual de concesión de créditos. Este modelo incorpora la

7
evaluación del riesgo en los procedimientos de admisión y clasificación de clientes,

como resultado observa un alto nivel de precisión en el modelo propuesto. Aunque

se mencionan ligeras variaciones atribuibles a un posible sesgo humano, en esta

investigación se demuestra la factibilidad del modelo propuesto para mejorar la

medición del riesgo crediticio en la Edpyme Alternativa S.A. La inclusión de nuevas

tecnologías, como el aprendizaje automático y la IA. (Eduardo C., 2022) en su

investigación utilizó un modelo de RL para estimar la probabilidad de incumplimiento

de clientes en la financiera Proempresa, La metodología aplicada implica la

estimación de un modelo logístico utilizando datos históricos de clientes de la

financiera Proempresa. La elección de un modelo logístico sugiere que se están

analizando variables para prever la probabilidad de que un cliente incumpla sus

compromisos crediticios, como resultado afirma que el modelo logístico propuesto

es significativo y sirve como una herramienta útil para evaluar la incidencia de las

variables en la posibilidad de incumplimiento (default) de los créditos en el caso de

la financiera Proempresa.

Teorias

Como bases teóricas ML es una disciplina que se centra en el diseño de

algoritmos para permitir que las computadoras aprendan a partir de datos y

desarrollen comportamientos o realicen tareas específicas sin ser programadas

explícitamente. Este enfoque se aplica a través de diversas técnicas y

metodologías, como el aprendizaje supervisado, no supervisado y semi-

supervisado, y está arraigado en el descubrimiento de patrones en grandes

conjuntos de datos (Andres M., 2018). La regresión logística se define como un

conjunto de técnicas estadísticas diseñadas para examinar hipótesis o relaciones

causales entre una variable dependiente categórica y otras variables

8
independientes, que pueden ser tanto categóricas como cuantitativas. El objetivo

principal de este modelo es estudiar la probabilidad de que ocurra un evento

específico en función de variables que se consideran relevantes o influyentes

(Martínez P. & Pérez M., 2022). El riesgo financiero se refiere a la posibilidad de que

los resultados reales de una inversión o decisión financiera difieran de los resultados

esperados. Implica la probabilidad de pérdida financiera o la falta de cumplimiento

de las expectativas financieras, y está asociado con la incertidumbre y la variabilidad

en los mercados financieros y económicos (Jaime D. & Edisson C., 2017).

ll. METODOLOGÍA
2.1. Tipo y diseño de investigación

2.2. Población, muestra y muestreo (incluir criterios de selección)

2.3. Hipótesis
Problema General
● ¿En qué medida ML permite predecir el riesgo crediticio de un cliente en la
empresa GRUPO TOVAR, 2023?

Hipótesis General:
● HN: El uso de Machine Learning no tiene un impacto significativo en la
predicción del riesgo crediticio de los clientes en la empresa GRUPO
TOVAR SAC en 2023.
● HA: El uso de Machine Learning tiene un impacto significativo en la
predicción del riesgo crediticio de los clientes en la empresa GRUPO
TOVAR SAC en 2023.

9
Planteamiento de los problemas específicos
● (1) ¿En qué medida ML con el modelo Logit permite predecir con precisión el
riesgo crediticio de un cliente en la empresa GRUPO TOVAR SAC, 2023?.
● (2) ¿En qué medida ML permite predecir con especificidad el riesgo crediticio
de un cliente en la empresa GRUPO TOVAR SAC, 2023?
● (3) ¿En qué medida ML permite predecir con rapidez el riesgo crediticio de
un cliente en la empresa GRUPO TOVAR SAC, 2023?

Hipótesis Específicas:

● HA(1.2): El modelo Logit de Machine Learning es más preciso que los


métodos tradicionales para predecir el riesgo crediticio de los clientes en la
empresa GRUPO TOVAR SAC en 2023.
● H0(1.1): El modelo Logit de Machine Learning no es más preciso que los
métodos tradicionales para predecir el riesgo crediticio de los clientes en la
empresa GRUPO TOVAR SAC en 2023.

● HA(2.2): El uso de Machine Learning mejora la especificidad en la predicción


del riesgo crediticio de los clientes en la empresa GRUPO TOVAR SAC en
2023 en comparación con los métodos convencionales.
● H0(2.1): El uso de Machine Learning no mejora la especificidad en la
predicción del riesgo crediticio de los clientes en la empresa GRUPO TOVAR
SAC en 2023 en comparación con los métodos convencionales.

● HA(3.2): El uso de Machine Learning reduce significativamente el tiempo


necesario para predecir el riesgo crediticio de un cliente en la empresa
GRUPO TOVAR SAC en 2023.
● H0(3.1): El uso de Machine Learning no reduce significativamente el tiempo
necesario para predecir el riesgo crediticio de un cliente en la empresa
GRUPO TOVAR SAC en 2023.

2.4. Variables y operacionalización

2.5. Técnicas e instrumentos de recolección de datos, validez y confiabilidad

2.6. Procedimientos

2.7. Análisis de datos

2.8. Aspectos éticos

10
III. ASPECTOS ADMINISTRATIVOS
3.1. Presupuesto y financiamiento

3.2. Cronograma de actividades

11
REFERENCIAS

Chen, Y., & de Luca, G. (2021). Technologies Supporting Artificial Intelligence and Robotics
Application Development. Journal of Artificial Intelligence and Technology, 1(1), 1–8.
https://doi.org/10.37965/JAIT.2020.0065

Eduardo C. (2022). Propuesta de un Modelo Logit para evaluar el riesgo crediticio en empresas
financieras: Financiera ProEmpresa.

Kidd, C., & Hayden, B. Y. (2015). The Psychology and Neuroscience of Curiosity. Neuron, 88(3),
449–460. https://doi.org/10.1016/J.NEURON.2015.09.010

Kumar, V., Saheb, S. S., Preeti, Ghayas, A., Kumari, S., Chandel, J. K., Pandey, S. K., & Kumar,
S. (2023). AI-Based Hybrid Models for Predicting Loan Risk in the Banking Sector. Big Data
Mining and Analytics, 6(4), 478–490. https://doi.org/10.26599/BDMA.2022.9020037

Luis L. (2022). Explicación y Predicción del default en créditos, con la implementación de


modelos de Machine Learning.

Olive V. (2019). Sistema predectivo basado en un modelo Credit Scoring de aprendizaje


automatico para la medición del riesgo crediticio en los créditos Pyme.

Orlova, E. V. (2020). Decision-making techniques for credit resource management using machine
learning and optimization. Information (Switzerland), 11(3).
https://doi.org/10.3390/INFO11030144

Suh, Y. (2023). Machine learning based customer churn prediction in home appliance rental
business. Journal of Big Data, 10(1). https://doi.org/10.1186/S40537-023-00721-8

Tofiq, Y. M., Latif, S. D., Ahmed, A. N., Kumar, P., & El-Shafie, A. (2022). Optimized Model Inputs
Selections for Enhancing River Streamflow Forecasting Accuracy Using Different Artificial
Intelligence Techniques. Water Resources Management, 36(15), 5999–6016.
https://doi.org/10.1007/S11269-022-03339-2

Wbeimar O, & Veronica J. (2021). Machine Learning para la estimación del riesgo de crédito en
una cartera de consumo.

Yang, X. (2023). Research on the Application of Big Data Intelligence Technology in the
Optimization of Accounts Receivable Management of E-commerce Enterprises Under the
Financial Sharing Mode. International Journal of Computational Intelligence Systems, 16(1).
https://doi.org/10.1007/S44196-023-00293-8

Yaranga V. (2022). Machine Learning para predecir el riesgo crediticio de un cliente en la


Empresa FUTECH PERU S.A.C, 2022.

12
Zohdi, M., Rafiee, M., Kayvanfar, V., & Salamiraad, A. (2022). Demand forecasting based
machine learning algorithms on customer information: an applied approach. International
Journal of Information Technology (Singapore), 14(4), 1937–1947.
https://doi.org/10.1007/S41870-022-00875-3

Andres M. (2018). Introducción a Machine Learning.

Jaime D., & Edisson C. (2017). Lógica difusa y el riesgo financiero. Una propuesta de
clasificación de riesgo financiero al sector cooperativo. Contaduría y Administración, 62(5),
1670–1686. https://doi.org/10.1016/J.CYA.2017.09.001

Martínez P., & Pérez M. (2022). Regresión logística. Medicina de Familia. SEMERGEN, 50(1),
102086. https://doi.org/https://doi.org/10.1016/j.semerg.2023.102086

Russell S. & Norvig P. (2018). Inteligencia Artificial un enfoque moderno (2da Edición).
España: Pearson Educación.

Hurwitz, J., & Kirsch, D. (2018). Machine Learning. (I. John Wiley & Sons, Ed.) New York: IBM
Limited Edition.

Banco Central de Reserva del Perú. (2022). Reporte de estabilidad financiera.

William, R. (2020) “La tecnología generará nuevas oportunidades de crecimiento”. Diario La


Republica

13
ANEXOS

14

También podría gustarte