Evaluación Del Impacto de La Inteligencia Artificial Generativa en El Trabajo
Evaluación Del Impacto de La Inteligencia Artificial Generativa en El Trabajo
Evaluación Del Impacto de La Inteligencia Artificial Generativa en El Trabajo
IAGen
IAGen
1. Derecho. I. Título.
CDD 344.0101
Investigación
Abril 2024
Equipo de trabajo
Dirección
Enzo Le Fevre
Doctor en Políticas Públicas. Master en Inteligencia Artificial para los servicios públicos. Jefe de
sector de la Comisión Europea.
Las opiniones expresadas por el autor son estrictamente personales y no reflejan necesariamente las de la Comisión
Europea.
Soledad Guilera
Magister en Estudios Internacionales. Profesora en la Universidad de California en Berkeley (EEUU)
y en la Universidad Torcuato Di Tella (Argentina). Team Leader del AI Policy Clinic del Center for
Artificial Intelligence and Digital Policy (EEUU).
Consultores Especialistas
Belen Carreira
Milagros Etcheberry Le Fort
Pamela Tolosa
Equipo de Investigación
Carina Mariel Papini
Florencia Croci
Margarita Gonzalez
Sol Roschkavan
Diseño
Paula C. Petroni
Victoria Mafud
Agradecimientos
Este trabajo es el resultado de la colaboración de equipos de pruebas, que participaron activamente
en la documentación de los casos de usos que forman parte de este documento, por ello
agradecemos especialmente:
Juan Alonso, Silvina Ailén Arias, María Emilia Arieau, Belén Arrua, Ana M. Basualdo, Daniel Horacio
Bravo, Santiago Botero Ceballos, Enrique Carrara, Sofía Carrión Luna, Daniela Cevallos, Alejandro
Corello, Florencia Marina Davesa, Georgina De Loredo Borras, Javier Echazu, Rocío Gallardo, Gabriel
Gamarra, Lucas Yamil Julio, Aylen Katopodis, Lucas Monia, Matias Moyano, Georgina Natta, Giannina
Nediani, Franco Orellana, Marcela Blanca Peltier, Camila Pentecoste, Alejandro Pietragalla, Laura
Poletti, María Victoria Quiñones, Marisa Repetto, Yeison Jairo Rincón Rendón, Darío Robaina, Marco
Rossi, María Candela Ruano, Marisa Salinas, Silvina Serra Ottonello, Valeria Stoffel, Jorge Eduardo
Tolava, Andrea Tovar, Natalia Varela, Laura Viñas y Adolfo Iriarte Yanicelli.
Índice
Resumen ejecutivo................................................................................ 8
Eficiencia según el nivel de complejidad
Eficiencia según el nivel de juicio humano requerido
Eficiencia según el grado de repetitividad
Eficiencia según la posibilidad de automatización
Eficiencia según el nivel de incidencia de la IAGen
1. Contexto, oportunidad y justificación............................................. 11
a. Tendencias y panorama en el mundo del trabajo
b. La Cuarta Revolución Industrial y el auge de sistemas
inteligentes de procesamiento de lenguaje natural
c. ChatGPT y las claves de su éxito
2. Propósitos y problemas de investigación ..................................... 19
3. Marco de referencia conceptual y metodología............................ 22
a. Conceptos relacionados con la inteligencia artificial
b. Metodología y objetivos
a) Eficiencia
b) Grado de automatización de la tarea
c) Eficacia: incidencia de la IAGen en la ejecución de la tarea
b. Optimización de tiempos
c. Complejidad
d. Grado de automatización
d. Repetitividad de las tareas
f. Juicio humano requerido
g. Incidencia de la IAGen en la tarea
h. Eficiencia
Eficiencia según el nivel de complejidad de la tarea
Eficiencia según el nivel de juicio humano requerido
Eficiencia según el grado de repetitividad de la tarea
Eficiencia según el grado de automatización de las tareas
Eficiencia según el nivel de incidencia de la IAGen en la tarea
j. Habilidades
k. Lecciones aprendidas
ANEXO I. Resultados.......................................................................... 68
a. Sector y áreas comprendidos en la investigación
1. Administración Pública
2. Justicia
3. Estudios jurídicos / áreas legales de empresas
4. Traducción
5. Educación
b. Optimización de tiempos
c. Nivel de complejidad de las tareas
1. Tareas de complejidad alta
2. Tareas de complejidad media
3. Tareas de complejidad baja
Resumen ejecutivo
A través del estudio de 83 tareas, se observa una mejora significativa en los tiempos
requeridos para su realización, con una reducción promedio del 77% en el tiempo necesario
para completarlas, gracias a la utilización de herramientas de IAGen. Además, se identifica
un nivel de eficiencia máximo del 99% para la elaboración de un borrador de traducción de
15.000 palabras.
La alta eficiencia (81%) de la IAGen en tareas que requieren un alto nivel de juicio humano
demuestra su potencial para asistir o complementar el trabajo humano en tareas complejas.
Esto es un claro indicio acerca de cómo la IAGen ha avanzado para abordar tareas más
sofisticadas que requieren un grado significativo de discernimiento o decisión. Por otra parte,
la incorporación de IAGen como apoyo para la realización de una tarea puede dar lugar a
subtareas que antes no existían pero que son necesarias para lograr una real optimización
de la tarea elegida.
Además, el análisis destaca que las herramientas de IAGen presentan un alto potencial para
la automatización de tareas rutinarias, bien definidas, estructuradas o de complejidad media
y alta, mientras que su beneficio es menor en tareas más simples. Esto puede obedecer a
1 A fin de analizar el impacto se realizaron pruebas en siete poderes judiciales de Argentina, en dos áreas de la Administración Pública y en cinco
estudios jurídicos y áreas legales de empresas.
8
INVESTIGACIÓN: IA GENERATIVA EN EL TRABAJO
que no todas las tareas resultan igualmente adecuadas para la automatización con IAGen.
Ello varía de una institución a otra, y requiere de un análisis específico de cada uno de los
procesos para determinar cómo y cuándo implementar herramientas de IAGen.
Cuando se trabaja en casos de uso dentro de una organización, las mejoras pueden
presentarse tanto en términos cuantitativos como en términos cualitativos. Las mejoras
cuantitativas son las que describimos, en esencia y principalmente, en el presente informe
y que se reflejan en disminuciones del tiempo necesario para la realización de la tarea. Las
mejoras cualitativas son aquellas que implican una mejora en la calidad del resultado que
se espera de una determinada tarea. Estas últimas, pueden o no significar un ahorro de
tiempo en la realización de la tarea, pero suelen ser de gran utilidad a la hora de aumentar
la competitividad de la organización.
Los resultados obtenidos dan cuenta de la presencia de un nuevo paradigma sobre cómo
entender y aplicar IAGen en las tareas y trabajos.
9
Pruebas en
INVESTIGACIÓN: IA GENERATIVA EN EL TRABAJO
83 tareas
de las 83 tareas
Eficiencia según
Complejidad el nivel de complejidad
10
11
1 CONTEXTO,
OPORTUNIDAD
Y JUSTIFICACIÓN
INVESTIGACIÓN: IA GENERATIVA EN EL TRABAJO
Contexto, oportunidad
y justificación
Los mercados laborales enfrentan desafíos significativos. Con altas tasas de desempleo
y subempleo, muchas veces resulta difícil para las personas encontrar trabajo. También
tiene lugar un desajuste significativo de habilidades, donde hay una discrepancia entre las
habilidades de la fuerza laboral y las necesidades de los empleadores. Los desafíos de la
automatización y la digitalización transforman los empleos disponibles y requieren nuevas
habilidades; la creciente precariedad laboral, con un aumento de trabajos temporales o
contractuales que ofrecen menos seguridad y beneficios; las desigualdades de ingresos
pronunciadas entre diferentes sectores, regiones y grupos demográficos; las condiciones
laborales inseguras o explotadoras en ciertos sectores o regiones; los efectos de los
cambios demográficos, como el envejecimiento de la población, que impactan la oferta
y la demanda de trabajo; barreras a la movilidad laboral, son algunos de los desafíos que
enfrenta el mercado laboral actual.
Sumado a ello, la crisis del COVID-19 ha contribuido, por un lado, a acelerar ciertas
transformaciones que ya se evidenciaban, como la adopción a gran escala del teletrabajo
y la proliferación de plataformas digitales. Pero, simultáneamente, introdujeron nuevas
formas de control del desempeño y productividad de los trabajadores derivadas de las
innovaciones tecnológicas2.
2 Novick Marta, Andrade Eliana, Ballatore Ferretti Lucila, Estrella María Josefina, Malpede Agustín, Munilla Diana, Núñez Vanesa, Parrilla SantIAGeno,
Pieckeinstain Lucía, Pomar Tomás, “Tecnología y Digitalización: El desafío Sindical”, SinDigital, mayo 2022.
12
INVESTIGACIÓN: IA GENERATIVA EN EL TRABAJO
3 Ripani Laura, “Impacto del COVID-19 en el mercado laboral: ¿Qué ha pasado desde la crisis económica, y qué sigue?” BID, mayo 2022, disponible en:
https://blogs.iadb.org/trabajo/es/el-mercado-laboral-desde-el-covid-19/ (consultado el 4 de marzo de 2024).
4 “Perspectivas sociales y del empleo en el mundo. Tendencias 2023”, Organización Mundial del Trabajo, Informe de Referencia, Resumen Ejecutivo,
disponible en: https://www.ilo.org/wcmsp5/groups/public/---dgreports/---dcomm/---publ/documents/publication/wcms_865368.pdf (consultado el
4 de marzo de 2024).
5 “Perspectivas sociales y del empleo en el mundo. El valor del trabajo esencial”, Organización Mundial del Trabajo, Informe de Referencia, Resumen
Ejecutivo, disponible en: https://www.ilo.org/wcmsp5/groups/public/---dgreports/---dcomm/---publ/documents/publication/wcms_871018.pdf
(consultado el 4 de marzo de 2024).
6 “Perspectivas sociales y del empleo en el mundo. Tendencias 2023”, Organización Mundial del Trabajo, Informe de Referencia, Resumen Ejecutivo,
disponible en: https://www.ilo.org/wcmsp5/groups/public/---dgreports/---dcomm/---publ/documents/publication/wcms_865368.pdf (consultado el
4 de marzo de 2024).
7 https://hipermediaciones.com/2018/06/10/la-4o-revolucion-industrial/ (consultado el 4/03/2024)
8 “Los sistemas mainframe son computadoras de alto rendimiento con grandes cantidades de memoria y procesadores que procesan miles de
millones de cálculos y transacciones simples en tiempo real. El mainframe es fundamental para bases de datos comerciales, servidores de
transacciones y aplicaciones que requieren seguridad y agilidad. Ver IBM, “¿Qué es un mainframe, disponible en: https://www.ibm.com/mx-es/
topics/mainframe (consultado el 2/03/2024)
13
INVESTIGACIÓN: IA GENERATIVA EN EL TRABAJO
Hasta 2020, los agentes conversacionales existentes no podían evitar por más de un par
de líneas, arrojar incoherencias, reproducir sesgos discriminatorios y cambiar de tema
repentinamente para omitir la charla incómoda. Replika11, Kuki12 y Dynabench13 dejaron
mucho que desear cuando se trató de simular el entendimiento del lenguaje natural como lo
hace un ser humano14. Esto, si lograban no ser un completo desastre a diferencia de lo que
sucedió con otros intentos, como el chatbot Tay de Microsoft15 que debió ser desactivado a
horas de su lanzamiento por publicar consignas nazis, entre otras atrocidades.
A medida que las técnicas basadas en aprendizaje profundo -redes neuronales- se fueron
sofisticando y optimizando, provocaron un salto exponencial en el rendimiento de los
modelos de lenguaje, y posibilitaron que los sistemas de IA puedan resolver proezas cada
vez más sofisticadas.
14
INVESTIGACIÓN: IA GENERATIVA EN EL TRABAJO
Así fue como en junio de 2020, OpenAI presentó la primera versión de GPT-3, 100 veces más
grande que su versión anterior, GPT-2 (2019). De balbuceos supuestamente terapéuticos
y experimentos de etiquetado manual del discurso del odio16, los usuarios pasaron a
interactuar con un chatbot predictivo, en el que unas pocas líneas podrían desembocar
automáticamente en un artículo periodístico, una poesía, acordes de guitarra, códigos
informáticos y hasta un resumen de texto. Y aunque distaba mucho de ser perfecto, parecía
ser que la revolución del procesamiento del lenguaje natural había comenzado.
Si GPT-3 se nutrió con 410.000 millones de textos17, esta tendencia no ha ido más que en
ascenso durante el 2021, al punto de considerarlo como el año de los modelos de lenguaje
gigantes18. De este modo, mientras las hazañas de las Big Tech para entender el habla
humana se enfocaron en absorber cada vez más texto online, los problemas asociados a
su empleo, como la reproducción de sesgos injustos y la falta de comprensión del lenguaje
persistieron. Se replicó una y otra vez la misma metodología, pero con mayor escala y
alcance, lo cual resultó extremadamente costoso y complejo, y derivó en que su exclusivo
aprovechamiento y beneficio se concentre en manos de unas pocas empresas creadoras.
En 2022, las innovaciones se inclinaron hacia modelos que fueran capaces no sólo de
procesar texto, sino también imágenes. Los expertos se dieron cuenta de que, si lograban
que los sistemas pudieran “ver”, podrían enmendar ciertos problemas de sentido común
de las máquinas, para imitar un proceso de aprendizaje que guarde mayor similitud con el
de un cerebro humano. Así nacieron los modelos multimodales. Ejemplo de estos han sido
DALL-E 219 y CLIP20 de OpenAI o Stable Diffusion21 de Stability AI.
16 “Perspectivas sociales y del empleo en el mundo. Tendencias 2023”, Organización Mundial del Trabajo, Informe de Referencia, Resumen Ejecutivo,
disponible en: https://www.ilo.org/wcmsp5/groups/public/---dgreports/---dcomm/---publ/documents/publication/wcms_865368.pdf (consultado el
4 de marzo de 2024).
17 Heaven, Will Douglas, “OpenAI’s new language generator GPT-3 is shockingly good—and completely mindless”, MIT Technology Review, 20 de
julio de 2020, disponible en: https://www.technologyreview.com/2020/07/20/1005454/openai-machine-learning-language-generator-gpt-3-nlp/
(consultado el 4 de marzo de 2024)
18 Heaven Will Douglas “2021: El año de los modelos de inteligencia artificial gigantes” MIT Technology Review, 27 de diciembre de 2021, disponible en:
https://www.technologyreview.es/s/13901/2021-el-ano-de-los-modelos-de-inteligencia-artificial-gigantes (consultado el 4 de marzo de 2024)..
19 https://openai.com/dall-e-2 (consultado el 4 de marzo de 2024)
20 https://openai.com/research/clip (consultado el 4 de marzo de 2024)
21 https://stability.ai/ (consultado el 4 de marzo de 2024).
22 OpenAI anunció el lanzamiento de ChatGPT el 30 de noviembre de 2022. ChatGPT está construido sobre la base de GPT-3.5 de OpenAI y versiones
posteriores, y fue diseñado para proporcionar una experiencia de usuario más interactiva y conversacional.
15
INVESTIGACIÓN: IA GENERATIVA EN EL TRABAJO
obtuvo más de 100 millones de usuarios registrados en tan solo cinco días23. La llegada
de ChatGPT ha repercutido en todas las profesiones y ámbitos del conocimiento, como la
educación, la programación, el derecho, el arte y la política.
¿Por qué ChatGPT? Ni la propia OpenAI imaginó que su producto se iba a convertir en un
mega éxito viral24. Sin embargo, ahora que han pasado unos meses y podemos examinarlo
retrospectivamente, creemos que su adopción masiva puede explicarse a partir de varios
factores.
En primer lugar, el rendimiento. Hemos sintetizado unas líneas atrás como los modelos
de lenguaje se han sofisticado rápidamente en un par de años, imitando cada vez mejor
el lenguaje como si fuera generado por un humano. Si bien ChatGPT no es perfecto, ha
aumentado considerablemente la calidad de sus respuestas respecto de su predecesor
GPT-3, tal como lo hemos demostrado en una serie de experimentos que llevamos a cabo
desde UBA IALAB25.
ChatGPT ha resultado atractivo para los usuarios en ese sentido porque cuando se intenta
de forma directa hacerlo incurrir en estos supuestos, es capaz de evadir la respuesta,
exigiendo mayores esfuerzos a quien se proponga burlar las reglas. Mientras que el
mencionado Tay en 2016, al cabo de unas horas se volvió fan de Hitler, ChatGPT pone la
creatividad a funcionar para quien quiera hacerlo arrojar respuestas de este estilo, y cuando
estas personas lo logran, los desarrolladores actualizan el modelo y corrigen el defecto.
Por otro lado, si ChatGPT se equivoca y el usuario se lo señala, este reconoce su error y
cambia la respuesta. Esto, independientemente de si la persona introdujo absurdidades
o no. En este sentido, el chatbot materializa el viejo eslogan atribuido a un comerciante
londinense a principios del siglo XX: “el cliente siempre tiene razón”. Es decir, el modelo es
superador en cuanto a su flexibilidad y capacidad de aprendizaje.
23 https://www.forbesargentina.com/innovacion/threads-ya-record-convierte-app-crecimiento-mas-rapido-historia-n36788#:~:text=en%20dos%20
meses.-,Al%20lograr%20el%20hito%20en%20menos%20de%20cinco%20d%C3%ADas%2C%20Threads,100%20millones%20en%20dos%20meses.
24 Heaven Will Douglas, “Esta conversación exclusiva con los creadores de ChatGPT evidencia la sorpresa de su éxito” MIT Technology Review, marzo
2023, disponible en: https://www.technologyreview.es/s/15168/esta-conversacion-exclusiva-con-los-creadores-de-chatgpt-evidencia-la-sorpresa-
de-su-exito (consultado el 4 de marzo de 2024).
25 “ChatGPT vs. GPT-4 ¿Imperfecto por diseño?” UBA IALAB, disponible en: https://ialab.com.ar/wp-content/uploads/2023/03/Libro-ChatGPT-vs-GPT-4.-
UBA-Thomson-Reuters-La-Ley.pdf (consultado el 4 de marzo de 2024).
26 En distintas investigaciones desarrolladas desde UBA IALAB, hemos destacado la necesidad de conocer y comprender las limitaciones intrínsecas
y externas de los grandes modelos de lenguajes como ChatGPT, que dan lugar a que los modelos alucinen; generen contenido dañino y/o brinden
respuestas sesgadas por reproducir o reflejar estereotipos de género, prejuicios, creencias o valores sociales negativos. Sobre el punto se sugiere
ampliar y ver algunos ejemplos en virtud de las pruebas realizadas para analizar la posibilidad de estos modelos de arrojar respuestas sesgadas,
incoherentes o fantaseadas: “ChatGPT vs. GPT-4: ¿imperfecto por diseño?”, UBA IALAB - Thomson Reuters La Ley, marzo de 2023, p.15-16,
disponible en: https://ialab.com.ar/wp-content/uploads/2023/03/Libro-ChatGPT-vs-GPT-4.-UBA-Thomson-Reuters-La-Ley.pdf (consultado el
5/03/2024)
16
INVESTIGACIÓN: IA GENERATIVA EN EL TRABAJO
En segundo lugar, debe reconocerse que la plataforma es simple e intuitiva, incluso más fácil
de manejar que muchas de las redes sociales masivas que conocemos. Antes de ChatGPT,
los modelos de lenguaje como GPT-3 eran accesibles a través de una lista de espera que
gestionaba la empresa creadora, en la que los usuarios tenían que ingresar muchos datos
para ingresar. Además, una vez habilitados, la interfaz era un poco más compleja, con una
larga lista de tareas que uno podía seleccionar y con ciertas configuraciones que podían ser
ajustadas por aquellas personas con conocimiento técnico.
Ahora ChatGPT permite loguearse con tan solo un mail y una contraseña. Y para utilizarlo
basta con escribir un mensaje en una línea de chat, tal como se hace cuando habla con
sus amigos en WhatsApp, Telegram o WeChat, plataformas con las que ya todos estamos
familiarizados. A partir de ahí, puede pedirle todo tipo de proezas características del lenguaje
natural, como escribir una poesía, traducir un texto o contar una historia.
En base a estas facilidades, más en evidencia se ha puesto el contraste con otras empresas
competidoras acerca de su tendencia de mantener sus innovaciones en la materia lejos del
alcance del público. Existe consenso entre los expertos al afirmar que los últimos modelos
de OpenAI no son ni los primeros, ni los únicos en desarrollar tecnologías tan avanzadas.
No hay razones para pensar que Google o Meta están por debajo de ellos o incluso que no
los superan. La diferencia es que OpenAI viene siguiendo una política de apertura, lanzando
productos defectuosos para que la sociedad se vaya adaptando y colabore en corregir esos
defectos, en el caso de ChatGPT indicando, por ejemplo, qué opción de respuesta te ha
resultado más útil.
En tercer lugar, ChatGPT es extremadamente útil para los usuarios al realizar todo tipo de
tareas basadas en lenguaje natural. Puede contestar mails, organizar itinerarios de viajes,
asistir en la resolución de trabajos académicos y hasta corregir un código informático.
En este sentido, tiene el potencial de facilitar un porcentaje significativo de las tareas que
llevamos a cabo cotidianamente.
Pero la utilidad no solo es importante para el usuario medio, sino también para los
desarrolladores. Más bien nos referimos a la escalabilidad, cuando, al ser un modelo
pre-entrenado (como lo indican su siglas en inglés Generative, Pre-trained, Transformer),
permite tomarlo, calibrarlo o reutilizarlo para volverlo especialista en campos específicos
17
INVESTIGACIÓN: IA GENERATIVA EN EL TRABAJO
Casi siete horas es el tiempo promedio diario que las personas del mundo pasan conectadas
a internet28. Este espacio virtual, en el que habitamos gran parte de nuestro día, está
gobernado por unos pocos gigantes tecnológicos que se han lanzado en una carrera por
quedarse con el mercado del software.
Microsoft ha adquirido los derechos para el uso de ChatGPT y el resto de las herramientas de
OpenAI convirtiéndose en su accionista mayoritario. De esta forma integró estos sistemas
de IA tan potentes a su motor de búsqueda Bing, como a todas las herramientas que
forman parte del paquete Office (Word, Excel y Power Point). A comienzos de 2024, Google
lanzó Gemini que busca ser el sucesor de PaLM, el modelo de lenguaje que actualmente
utiliza Bard. La idea es que poco a poco PaLM sea reemplazado por Gemini dentro de Bard.
Gemini se destaca por superar a todos sus rivales en los principales tests, adelantándose a
GPT-4 de OpenAI29.
27 Para conocer algunos ejemplos vea, Fernández Yúbal, “26 proyectos basados en ChatGPT: alternativas de Inteligencia Artificial para crear textos,
webs, partidas de rol y más”, Xataka, febrero 2023, disponible en: https://www.xataka.com/basics/26-proyectos-basados-chatgpt-alternativas-
inteligencia-artificial-para-crear-textos-webs-partidas-rol (consultado el 4 de marzo de 2024).
28 Pasquali Marina, “¿Cuántas horas al día pasamos conectados a internet?”, Statista, febrero 2023, disponible en: https://es.statista.com/
grafico/22701/tiempo-medio-de-uso-diario-de-internet/#:~:text=Seis%20horas%20y%2037%20minutos,Overview%20Report%22%20publicado%20
por%20DataReportal (consultado el 4 de marzo de 2024).
29 https://www.xataka.com/basics/google-gemini-que-como-funciona-diferencias-gpt-cuando-podras-usar-este-modelo-inteligencia-artificial
(consultado el 26/02/2024)
18
19
2 PROPÓSITOS
Y PROBLEMAS
DE INVESTIGACIÓN
INVESTIGACIÓN: IA GENERATIVA EN EL TRABAJO
Propósitos y problemas
de investigación
E n 2019, desde UBA IALAB impulsamos una investigación que se publicó bajo el título
“Inteligencia Artificial y Trabajo. Construyendo un nuevo paradigma de empleo”30, bajo la
autoría de Luis Cevasco, Juan Gustavo Corvalán y Enzo María Le Fevre Cervini, y prologado
por el Jefe del Departamento de Políticas Macroeconómicas de la OIT -Dr. Ekkerhard Ernst-.
Esa investigación tuvo como objetivo evaluar el impacto de la automatización en el trabajo,
y una de las principales estrategias utilizadas fue hacerlo en base al sistema inteligente
Prometea, impulsado por el mismo equipo, en la confección de opiniones legales en la
justicia.
A raíz de ello, y en virtud de los datos producidos por otras mediciones31, algunas de las
conclusiones más relevantes en ese entonces fueron las siguientes:
Aunque sólo han pasado cinco años desde la publicación de ese libro, los cambios abruptos
que se han evidenciado desde ese entonces nos obligan a revisar y a poner a prueba
dichas conclusiones. Como hemos explicado al desarrollar el contexto, desde 2019 nuestra
sociedad ha atravesado y superado una pandemia de alcance mundial que implicó diversas
modificaciones en el mercado de trabajo. Por otro lado, a nivel tecnológico, el boom de
ChatGPT fue el punto de partida para la popularización de la IAGen que ahora se encuentra
al alcance de todos.
20
INVESTIGACIÓN: IA GENERATIVA EN EL TRABAJO
determinado sistema inteligente diseñado a medida para un entorno, puede tener en una
organización distinta. En contraste, la ventaja que presenta ChatGPT es que su adopción
masiva nos permite considerar sus consecuencias en el ámbito laboral de cualquier tarea
en cualquier organización, sea en el campo del derecho, como en otros campos tales como
la educación o la salud.
21
22
3
METODOLOGÍA
INVESTIGACIÓN: IA GENERATIVA EN EL TRABAJO
Metodología de investigación
Sectores comprendidos en la investigación
con IAGen
Tiempo para la realización de la
Cuantitativos tarea, subtarea y microtarea
sin IAGen
Esto incluye:
• Tiempo para la confección y
adaptación del prompt
• Tiempo de control humano ex post
• Nivel de repetitividad de la tarea:
Alta // Media // Baja
Cualitativos
Marco de referencia
conceptual y metodología
S erán conceptos claves para el presente trabajo aquellos relacionados con la inteligencia
artificial que han surgido, se han popularizado y difundido durante el último periodo de
crecimiento y sofisticación acelerada de los modelos de procesamiento de lenguaje natural
que hemos desarrollado en el marco contextual. Asimismo, otros conceptos relevantes
serán aquellos que nos permitan clasificar y categorizar tareas laborales para aplicar la
metodología de investigación y obtener conclusiones acerca del impacto de ChatGPT y la
IAGen en estas.
Los modelos de aprendizaje profundo en los que se basa la IAGen, pueden tomar datos sin
procesar y aprender a generar resultados estadísticamente probables cuando se le soliciten.
Codifican una representación simplificada de sus datos de capacitación o entrenamiento
y los extraen para generar resultado similar, pero no idéntico, a los datos originales34. En
esencia, la IAGen puede crear nuevos datos, a diferencia de la IA tradicional que trata de
etiquetar o categorizar datos35.
32 OECD, “Explanatory memorandum on the updated OECD definition of an AI system”, 5 de marzo de 2024, disponible en: https://www.google.com/
url?q=https://www.oecd-ilibrary.org/science-and-technology/explanatory-memorandum-on-the-updated-oecd-definition-of-an-ai-system_623da898-
en&sa=D&source=docs&ust=1714003814501233&usg=AOvVaw3zE93o-goYZNdrmyBjmoOO (consultado el 5/03/2024)
33 OECD Artificial Intelligence Papers, Initial Policy Considerations for Generative Artificial Intelligence, septiembre de 2023, disponible en: https://
www.oecd-ilibrary.org/deliver/fae2d1e6-en.pdf?itemId=/content/paper/fae2d1e6-en&mimeType=pdf (consultado el 28/02/2024)
34 Ver más en ¿Qué es la inteligencia artificial (IA)?, IBM, disponible en: ¿Qué es la Inteligencia Artificial (IA)? | IBM (consultado el 28/02/2024).
Ver también Greg Pavlik, ¿Qué es la IA Generativa? ¿Cómo funciona?, Oracle, 15 de septiembre de 2023, disponible en: ¿Qué es la inteligencia
artificial generativa? | Oracle Argentina (consultado el 28/02/2024).
35 Ver más en Elena Astorga, La inteligencia artificial generativa va a cambiar lo que significa ser humano, MIT Technology Review, 9 de agosto de
2023, disponible en: "La inteligencia artificial generativa va a cambiar lo que significa ser humano" | MIT Technology Review en español (consultado
24
INVESTIGACIÓN: IA GENERATIVA EN EL TRABAJO
Impacto36. “...implica cambios en la vida de las personas. Esto podría incluir cambios en
el conocimiento, la habilidad, el comportamiento, la salud o las condiciones de vida de
niños, adultos, familias o comunidades. Dichos cambios son efectos positivos o negativos
a largo plazo en grupos de población identificables producidos por una intervención de
desarrollo, directa o indirectamente, intencionada o no intencionada. Estos efectos pueden
ser económicos, socioculturales, institucionales, ambientales, tecnológicos o de otro tipo”37.
Prompt. Un prompt es una instrucción, pregunta o un texto que se utiliza para interactuar
con sistemas de inteligencia artificial. Podríamos decir que es como un comando a través
del cual un usuario le solicita al sistema que realice una tarea concreta38.
Grandes Modelos de Lenguaje. Los LLM -Large Lenguaje Models por sus siglas en inglés-
o modelos lingüísticos de gran tamaño, son sistemas de inteligencia artificial basados en
la técnica de redes neuronales que son entrenados con enormes cantidades de texto39. De
este modo, se vuelven capaces de procesar y generar lenguaje como si fueran personas
humanas. Se utilizan en diversas aplicaciones, incluidos chatbots, asistentes virtuales,
traducción de idiomas, creación de contenido e investigación científica. Como ejemplos,
podemos mencionar GPT-3, GLaM, Jurassic-1, Switch-Transformer y Gopher40.
Foundation Models. Los modelos de base o modelos de fundación son aquellos modelos
entrenados en datos amplios que se pueden adaptar a una amplia gama de tareas
posteriores41.
b. Metodología y objetivos
La aplicación de la IAGen introduce un nuevo paradigma en la comprensión y utilización de
IA en una amplia variedad de tareas y trabajos. Las pruebas realizadas en 83 tareas revelan
que los grandes modelos de lenguaje abren un universo de nuevas posibilidades para mejorar
la integración, la colaboración, la automatización y la accesibilidad en el ámbito laboral. Esta
innovación permite una sinergia y una cooperación sin precedentes. La automatización
adquiere una nueva dimensión con herramientas de IAGen capaces de realizar tareas con
el 28/02/2024)
36 A los fines de la presente investigación se tomó como referencia la definición que aporta el Grupo de las Naciones Unidas para el Desarrollo
Sostenible, que entiende que el impacto.
37 “Results Based Management”, United NationsDevelopment Group, octubre de 2011, p.7, disponible en: https://unsdg.un.org/sites/default/files/
UNDG-RBM-Handbook-2012.pdf (consultado el 04/03/2024)
38 https://www.xataka.com/basics/que-prompt-que-importantes-para-usar-inteligencia-artificial
39 Lancaster Anthony, “Beyond Chatbots: The Rise Of Large Language Models”, Forbes, marzo 2023, disponible en: https://www.forbes.com/sites/
forbestechcouncil/2023/03/20/beyond-chatbots-the-rise-of-large-language-models/?sh=4c9f9a2e2319 (consultado el 4 de marzo de 2024).
40 Heaven Will Douglas, “2021: el año de los modelos de inteligencia artificial gigantes”, MIT Technology Review, diciembre 2021, disponible en: https://
www.google.com/url?q=https://www.technologyreview.es//s/13901/2021-el-ano-de-los-modelos-de-inteligencia-artificial-gigantes&sa=D&source=
docs&ust=1714003865127686&usg=AOvVaw2hDbPUOffy9BhZY-nAUawh (consultado el 4 de marzo de 2024).
41 Rishi Bommasani, Percy Liang, “Reflections on Foundation Models”, Stanford University, Human-Centered Artificial Intelligence, octubre 2021,
disponible en: https://hai.stanford.edu/news/reflections-foundation-models Consultado el 4 de marzo de 2024).
25
INVESTIGACIÓN: IA GENERATIVA EN EL TRABAJO
42 Eloundou, Tyna - Manning, Sam - Mishkin, Sam - Rock, Daniel, “GPTs are GPTs: An Early Look at the Labor Market Impact Potential of Large
Language Models”,disponible en: https://arxiv.org/pdf/2303.10130.pdf (consultado el 7/03/2024)
43 En una segunda etapa, IALAB convocará referentes de otros vectores como la salud, recursos humanos y finanzas, a fin de comprender el impacto
en otros sectores.
26
INVESTIGACIÓN: IA GENERATIVA EN EL TRABAJO
Tal como lo prevé la metodología que sienta las bases de esta investigación44, se conformaron
equipos de prueba. Estos equipos tuvieron a su cargo la selección de los procesos y análisis
de tareas y subtareas que los componen, y aplicaron dicha metodología para documentar el
paso a paso de las mediciones obtenidas.
Asimismo, para evaluar el impacto que la IAGen tiene en los sectores comprendidos en esta
investigación, se utilizaron indicadores:
44 IALAB, Guía metodológica para la evaluación del impacto de la inteligencia artificial generativa en el empleo y las organizaciones. Identificación de
nuevas habilidades laborales, agosto de 2023, disponible en: https://ialab.com.ar/wp-content/uploads/2024/02/Guia-metodologica-1.pdf
(consultado el 26/02/2024)
27
INVESTIGACIÓN: IA GENERATIVA EN EL TRABAJO
Estas métricas se han elegido porque proporcionan una visión integral del impacto de la
IAGen en el trabajo. También permiten comprender la incidencia en tareas, subtareas y
microtareas según su grado de automatización, y, además, considerar otros factores como
la adaptabilidad de la herramienta y la experiencia del trabajador al utilizar la misma.
a. Eficiencia
- Con IAGen: mide el tiempo de ejecución de tareas antes y después de la implemen-
tación de IAGen en el proceso. Esto incluye mediciones sobre el tiempo de realiza-
ción de la tarea, subtarea y/o microtarea.
- Sin IAGen: aquí se mide el tiempo de realización de la tarea, subtarea y/o microtarea
de acuerdo a los procedimientos y herramientas de uso interno común, aprobadas
por la organización.
Aquí se identifica qué tareas pueden ser adecuadas para la automatización y cuáles son
más apropiadas para ser realizadas por humanos.
45 Eloundou, Tyna - Manning, Sam - Mishkin, Pamela - Rock, Daniel, “GPTs are GPTs: An Early Look at the Labor Market Impact Potential of Large
Language Models”, 27 de marzo de 2023, disponible en: https://arxiv.org/pdf/2303.10130.pdf
28
INVESTIGACIÓN: IA GENERATIVA EN EL TRABAJO
Los equipos de prueba seleccionaron y evaluaron las tareas en función de dos criterios
clave: la repetitividad y el juicio humano necesario, y a su vez las ponderaron de acuerdo a
la siguiente escala: alta, media, baja.
Veamos brevemente los conceptos utilizados como pilar para la definición de las tareas y/o
procesos seleccionados:
Repetitividad
Juicio humano
Se refiere a la capacidad de las personas para evaluar, analizar, tomar decisiones y resolver
problemas basados en su experiencia, conocimiento, valores y razonamiento. Implica la
habilidad para considerar múltiples factores, contextos y perspectivas al tomar decisiones
informadas.
29
INVESTIGACIÓN: IA GENERATIVA EN EL TRABAJO
• Juicio humano alto. El juicio humano requerido es alto ante situaciones complejas,
que usualmente requieren analizar múltiples variables y tomar decisiones fundamenta-
das. Sobre todo, se trata de situaciones de incertidumbre en donde el juicio humano de
la persona resulta clave para definir una ruta de acción, anticipar posibles consecuen-
cias, riesgos o daños.
• Juicio humano medio. Se trata de aquellas situaciones en las que las habilidades
de los trabajadores son importantes para evaluar y tomar decisiones en virtud de su
experiencia. Como por ejemplo: la capacidad de análisis, integración, y la observación.
• Juicio humano bajo. Las tareas que requieren un bajo nivel de juicio humano son
aquellas rutinarias y predecibles, que suelen tener procedimientos claramente defini-
dos. En ellas, no resulta necesario una evaluación profunda, análisis o toma de decisio-
nes basada en una vasta experiencia o conocimiento.
• Tareas Automatizables: tareas con alta repetitividad y bajo juicio humano requerido
son altamente automatizables. En este caso, la "programación de reuniones" y la "ges-
tión de bases de datos" se podrían considerar para la automatización.
• Tareas Semiautomatizables: tareas con alta repetitividad pero un grado medio de
juicio humano requerido podrían ser parcialmente automatizables, ya que podrían re-
querir alguna supervisión o intervención humana. En este ejemplo, la "respuesta a co-
rreos electrónicos" podría caer en esta categoría.
• Tareas NO Automatizables: tareas con baja repetitividad y alto juicio humano re-
querido son menos susceptibles para la automatización. Estas tareas suelen requerir
habilidades más complejas y la capacidad de tomar decisiones basadas en el juicio y la
experiencia humana. En este ejemplo, la "redacción de informes" y la "toma de decisio-
nes estratégicas" podrían ser consideradas tareas no automatizables.
30
INVESTIGACIÓN: IA GENERATIVA EN EL TRABAJO
c) Eficacia
46 Ver más en Cevasco, Luis. - Corvalán, Juan G., - Le Fevre, Enzo M., “Inteligencia Artificial y trabajo”, DPI Cuántico, IMODEV, año 2019, página 41,
disponible en: https://ialab.com.ar/wp-content/uploads/2023/03/ia_y_trabajo.pdf (consultado el 4/03/2024)
31
INVESTIGACIÓN: IA GENERATIVA EN EL TRABAJO
Uno de los puntos que se buscó analizar con esta investigación es la identificación de nuevas
habilidades requeridas en el mundo laboral a partir del impacto de la IAGen en las tareas.
Para ello, se seleccionaron algunas categorías de habilidades aprobadas por organismos
internacionales, tales como la Organización Internacional del Trabajo (OIT) y la Organización
para la Cooperación y Desarrollo Económicos (OCDE)47.
47 Competencias para el empleo, “Organización Internacional del Trabajo”, 18 de mayo de 2015, disponible en: https://www.ilo.org/skills/pubs/
WCMS_371815/lang--es/index.htm (consultado el 4/03/2024) Ver también OECD, “Skills for the Digital Transition: Assessing Recent Trends Using
Big Data”, 19 de octubre de 2022, disponible en: https://www.oecd.org/employment/skills-for-the-digital-transition-38c36777-en.htm (consultado el
4/03/2024)
32
INVESTIGACIÓN: IA GENERATIVA EN EL TRABAJO
• Ser adaptable
• Saber escribir como para satisfacer las necesidades del grupo objetivo
• Aceptar la retroalimentación
• Resolver conflictos
33
INVESTIGACIÓN: IA GENERATIVA EN EL TRABAJO
• Identificar problemas
• Visualización de datos
• Marco de ciberseguridad
• Seguridad de la red
• Seguridad de información
• Gestión de IT
• Aprendizaje automático
• Inteligencia artificial
• Big Data
• Computación en la nube
• Desarrollo web
• Java
• Computación distribuida
Desarrolladores de software,
• Aseguramiento de la calidad del software
programadores e ingenieros
• Gestión de IT
• Simulación
• Gestión de rendimiento
• Tensorflow
34
INVESTIGACIÓN: IA GENERATIVA EN EL TRABAJO
• Design thinking
• Investigación de usuarios
Diseñador UX/UI
• Desarrollo web
• Publicidad
• Gestión de marketing
• Soluciones de negocios
• Formación de empleados
• Pensamiento estratégico
• Inteligencia artificial
35
INVESTIGACIÓN: IA GENERATIVA EN EL TRABAJO
» Las pruebas seleccionadas, corresponden a una muestra aleatoria. Las personas con-
vocadas para realizar las pruebas tuvieron libertad para seleccionar las tareas y traba-
jaron con aquellas relacionadas con su labor cotidiana, con la condición de especificar
los detalles de su composición, como su grado de automatización y complejidad.
» Algunas pruebas no alcanzaron los niveles de eficiencia esperados, lo cual denota la
necesidad de que las personas se adapten al uso de las herramientas de IAGen y, en
otros casos, da cuenta de que la IAGen no es la herramienta más adecuada para ha-
cer más eficiente la tarea elegida (por ejemplo, para calcular plazos procesales).
» Algunas pruebas fueron realizadas por personas sin conocimientos previos en tecno-
logía y sin experiencia relevante en el uso de ChatGPT en sus trabajos, mientras que
otras fueron realizadas por alumnos del Posgrado de Inteligencia Artificial y Derecho
de la UBA quienes a lo largo de 9 meses, a partir de la workshops y talleres prácticos,
adquirieron las herramientas necesarias para aplicar IAGen en su labor diaria. Esto
demuestra, al menos a priori, que la optimización puede crecer si las personas tienen
formación específica en el uso de herramientas de IAGen, como ChatGPT.
» El estudio permite afirmar que aún sin conocimientos previos sobre ChatGPT, con una
selección criteriosa de la tarea a la cual aplicar dicha tecnología, es posible optimizar
las tareas en los distintos trabajos.
» La realización de las pruebas permitió observar que el usuario necesita un tiempo pru-
dencial para la generación de prompts detallados, contextuales y útiles para realizar
la tarea elegida.
» Este documento constituye el primer paso de la investigación que se está llevando
adelante desde UBA IALAB. Los resultados que aquí se presentan podrían modificar-
se. Principalmente, debido a que las pruebas no fueron repetidas por los responsa-
bles, lo que puede suponer una variación en los resultados aquí obtenidos.
36
37
4 RESULTADOS
DE LA INVESTIGACIÓN
INVESTIGACIÓN: IA GENERATIVA EN EL TRABAJO
de las tareas
Pruebas en
83 tareas:
áreas de Administración pública,
5 justicia, áreas legales y estudios
jurídicos, traducción, educación
optimización promedio
77% reducción de tiempo para
su realización
Aumento de eficiencia
en diversas tareas
90% 71%
97% Identificación de agravios
Redacción de un 95% en el recurso de
inconstitucionalidad
Planificación de una
actividad práctica en
contrato administrativo Realización de una copia educación
con modificaciones de un
contrato de arrendamiento
38
INVESTIGACIÓN: IA GENERATIVA EN EL TRABAJO
Hallazgos
39
INVESTIGACIÓN: IA GENERATIVA EN EL TRABAJO
IAGen
Tareas comparadas
IAGen
Redacción de un
contrato administrativo
6 60
minutos minutos
Identificación de agravios
en el recurso de casación
30 15
minutos minutos
40
INVESTIGACIÓN: IA GENERATIVA EN EL TRABAJO
Próximos pasos
Confirmar o refutar la hipótesis con repetición de casos
de uso y optimización de prompts
IAGen
01
tipos prompts para que funcionen como
próximos pasos
modelos o “templates” para optimizar
aún más la realización de diversas tareas
o subtareas?
02 03
¿Los prompts como templates ¿Se requiere que las personas se formen
pueden ser extrapolados a otros en el uso de la IA generativa de manera
procesos o tareas? óptima?
04 05
una mejora radical en términos de ocupe constantemente de enseñar,
optimización cuantitativa y/o ajustar e interactuar con la IA
cualitativa a mediano y largo plazo? generativa de manera estratégica
dentro de la organización?
41
INVESTIGACIÓN: IA GENERATIVA EN EL TRABAJO
Resultados de la investigación.
Análisis de los datos obtenidos.
a. Principales hallazgos
A partir del análisis de los resultados obtenidos en virtud de las pruebas realizadas, se
identifican los siguientes hallazgos:
42
INVESTIGACIÓN: IA GENERATIVA EN EL TRABAJO
43
INVESTIGACIÓN: IA GENERATIVA EN EL TRABAJO
b. Optimización de tiempos
A continuación, presentamos la eficiencia promedio alcanzada a partir de la utilización de
IAGen en cada uno de los sectores comprendidos en la investigación. La eficiencia fue
analizada teniendo en consideración el tiempo requerido para ejecutar la tarea sin y con
IAGen.
44
INVESTIGACIÓN: IA GENERATIVA EN EL TRABAJO
c. Complejidad
En cuanto al nivel de complejidad de las tareas:
c. Grado de automatización
En cuanto al grado de automatización de las tareas:
45
INVESTIGACIÓN: IA GENERATIVA EN EL TRABAJO
En este punto, es importante señalar que la clasificación de una tarea como “automatizable”,
“semiautomatizable” y “no automatizable” fue asignada por la persona responsable de la
realización de la prueba.
48 Por ejemplo, la redacción de una demanda por incumplimiento contractual en el marco de una relación de consumo identificación; la confección
de una demanda laboral; la individualización de agravios en recurso extraordinario provincial; identificación del objeto de la demanda; identificación
del objeto en un recurso de inconstitucionalidad; la redacción de una demanda de daños y perjuicios por responsabilidad contractual en contexto
de violencia de género y el análisis de un caso de astreintes, entre otros. Ver anexo contexto de las pruebas.
49 Por ejemplo, el armado de un glosario para una traducción de documento; la redacción de una carta documento judicial; la revisión de pliegos de
bases y condiciones en una contratación pública y la aplicación de lenguaje claro en el voto de una sentencia, entre otros. Ver anexo contexto de
las pruebas.
50 Por ejemplo, la elaboración de un correo electrónico en “lenguaje claro”; la redacción de resolución de adjudicación en un proceso de contratación
pública; la confección de un oficio judicial y el confronte de oficios, entre otras. Ver anexo contexto de las pruebas.
46
INVESTIGACIÓN: IA GENERATIVA EN EL TRABAJO
47
INVESTIGACIÓN: IA GENERATIVA EN EL TRABAJO
h. Eficiencia
1. Eficiencia según el nivel de complejidad de la tarea
48
INVESTIGACIÓN: IA GENERATIVA EN EL TRABAJO
51 Nótese que el número total de pruebas realizadas en tareas de juicio humano bajo fue sustancialmente menor que en tareas de juicio humano
medio o alto. Para entender mejor el desempeño de la IAGen en tareas de juicio humano bajo, es necesario realizar más pruebas en nuevas tareas
y analizar la eficiencia alcanzada.
49
INVESTIGACIÓN: IA GENERATIVA EN EL TRABAJO
Aclaración: Las tareas “no automatizables” son aquellas que así se consideraban
antes del impacto de la IAGen. En el 69% de los casos, esas tareas se vuelven al
menos en parte, en automatizables con IAGen.
50
INVESTIGACIÓN: IA GENERATIVA EN EL TRABAJO
• Complejidad: MEDIA
• Repetitividad: ALTA
• Juicio humano requerido: MEDIO
Esta tarea, al ser altamente repetitiva y de complejidad media, muestra una notable
mejora en la eficiencia gracias a la implementación de IAGen, lo que indica un
potencial significativo en la reducción del tiempo requerido para su realización.
52 La prueba se realizó en una dependencia de la Administración Pública de la Ciudad Autónoma de Buenos Aires. Puntualmente en el Ministerio de
Producción y Desarrollo Económico, (Gerencia jurídico-legal) cuya tarea principal es la confección y revisión de documentos jurídicos que tramitan
ante los organismos del Estado. A tales efectos se entiende por Contrato Administrativo: Un contrato administrativo es un acuerdo legal entre
una entidad gubernamental o administrativa y un contratista privado o una empresa para la realización de obras, la prestación de servicios, la
adquisición de bienes o cualquier otro tipo de actividad relacionada con los intereses públicos. Estos contratos pueden abarcar una amplia gama
de actividades, desde la construcción de infraestructuras públicas hasta la prestación de servicios de salud, educación, seguridad, entre otros. Su
objetivo principal es asegurar que los recursos públicos se utilicen de manera eficiente y que se satisfagan las necesidades de la comunidad en
general.
53 La prueba fue efectuada en el ámbito del estudio jurídico Alfaro Abogados. Para ello se proporcionó la materia, datos del demandado, fecha, lugar,
el vehículo, entre otros.
51
INVESTIGACIÓN: IA GENERATIVA EN EL TRABAJO
• Complejidad: ALTA
• Repetitividad: MEDIA
• Juicio humano requerido: ALTO
Esta prueba refleja el impacto significativo que la IAGen puede tener en tareas
legales complejas, al mejorar la eficiencia en la redacción y estructuración
de documentos legales, mientras que en tareas más rutinarias y de menor
complejidad, su impacto puede resultar aún mayor.
• Complejidad: BAJA
• Repetitividad: ALTA
• Juicio humano requerido: MEDIO
En este caso, a pesar del potencial de la IAGen para automatizar tareas rutinarias y
de baja complejidad con un alto nivel de eficiencia, el nivel medio de juicio humano
requerido subraya la necesidad de un equilibrio entre la tecnología y la supervisión
humana.
54 La prueba se realizó en una Gerencia de Compras y Contrataciones en la Administración Pública de la Ciudad Autónoma de Buenos Aires. La
contratación pública, también conocida como licitación pública, es el proceso mediante el cual las entidades públicas (gobiernos, empresas
estatales, etc.) adquieren bienes, servicios y obras necesarios para el funcionamiento de sus operaciones. Específicamente la licitación pública. Es
el procedimiento más común de contratación pública. Se basa en la presentación de ofertas por parte de las empresas interesadas en el contrato.
52
INVESTIGACIÓN: IA GENERATIVA EN EL TRABAJO
• Complejidad: MEDIA
• Repetitividad: MEDIA
• Juicio humano requerido: MEDIO
j. Habilidades
55 La prueba se realizó en una Gerencia de Compras y Contrataciones en la Administración Pública de la Ciudad Autónoma de Buenos Aires, sobre
un proceso de licitación pública regido por Ley de compras y contrataciones N° 2095. Puntualmente, se evaluó el uso de ChatGPT en el análisis de
ofertas presentadas en dicho proceso administrativo.
53
INVESTIGACIÓN: IA GENERATIVA EN EL TRABAJO
Las habilidades relacionadas con organizar y procesar información, como elegir la mejor
forma de abordar tareas, leer de manera competente y comprender el idioma, tienen una
eficiencia promedio del 99.94%.
Las habilidades centradas en el uso eficaz del tiempo muestran una eficiencia del 95%. Esto
indica el potencial de la IAGen para optimizar tiempos y mejorar la productividad.
Las habilidades de pensar en forma creativa y abstracta alcanzan una eficiencia del 86.67%.
Esto resalta la utilidad de la IAGen para apoyar tareas que requieren enfoques innovadores
y soluciones no convencionales.
Las habilidades que incluyen análisis, redacción de texto, ejecución, control y gestión tienen
una eficiencia del 85.83%. Esto indica que la IAGen es eficaz en tareas que combinan
aspectos analíticos y administrativos.
54
INVESTIGACIÓN: IA GENERATIVA EN EL TRABAJO
k. Lecciones aprendidas
En cuanto a la eficiencia:
» Algunas pruebas no alcanzaron los niveles de eficiencia esperados, lo que desta-
ca la necesidad de habituarse a trabajar con herramientas de IAGen en contextos
específicos.
» Resulta de utilidad medir el tiempo que insume la tarea con IAGen para calcular la op-
timización real que significa dentro de la carga laboral diaria, semanal o anual, y definir
estrategias de uso.
» Las mejoras cuantitativas son las que describimos, en esencia y principalmente, en
el presente informe y que se reflejan en disminuciones del tiempo necesario para la
realización de la tarea.
» Las mejoras cualitativas son aquellas que implican una mejora en la calidad del resul-
tado que se espera de una determinada tarea. Estas últimas, pueden o no significar
un ahorro de tiempo en la realización de la tarea, pero suelen ser de gran utilidad a la
hora de aumentar la competitividad de la organización.
Por ejemplo, si dentro de un estudio se usa ChatGPT para descubrir nuevos argumentos
que complementan los modelos o templates ya existentes, probablemente aumentará
el tiempo que insume la tarea, pero, sin dudas, aumentará la calidad del resultado ante
el cliente.
» La incorporación de IAGen como apoyo para la realización de una tarea puede dar
lugar a subtareas que antes no existían pero que son necesarias para lograr una real
optimización de la tarea elegida. Este el caso de la subtarea de anonimización o seu-
donimización de datos personales contenidos en documentos de trabajo. Es necesa-
rio optimizar la realización de esas subtareas para lograr la mejora de tiempos totales.
» La automatización no debe verse como un reemplazo del juicio humano, sino como
un complemento que mejora la eficiencia y la efectividad.
55
INVESTIGACIÓN: IA GENERATIVA EN EL TRABAJO
En general, la IAGen puede ser una herramienta útil para automatizar tareas legales simples,
como la identificación de agravios, la aplicación de lenguaje claro y la comparación de textos.
Sin embargo, siempre requiere supervisión humana posterior para garantizar la precisión y
la corrección jurídica.
La calidad del producto obtenido depende del prompt, pero también de la complejidad del
expediente y de la calidad del texto que se le proporciona a la IAGen para analizar. En virtud
de ello, en casos complejos o con escritos desordenados o mal redactados, la IAGen puede
tener dificultades para identificar elementos relevantes para lograr el objetivo buscado (ej.
extraer agravios de un recurso judicial).
56
INVESTIGACIÓN: IA GENERATIVA EN EL TRABAJO
Las tareas que requieren un análisis profundo del expediente, como la elaboración de un
dictamen fiscal o la resolución de un conflicto, pueden ser más difíciles de automatizar
con IAGen debido a su complejidad y la base de conocimiento de derecho nacional y local
necesaria para decidir los casos.
Inicialmente, las herramientas de IAGen no son de utilidad para realizar tareas relacionadas
con el cómputo de plazos procesales (por ejemplo, un plazo de caducidad en un contencioso
administrativo), dado que no logran ejecutar adecuadamente el prompt porque cometen
errores al realizar operaciones de cálculo de plazos.
Para finalizar, en virtud de las pruebas efectuadas y resultados alcanzados, nos proponemos
dar respuesta a los tres interrogantes planteados en los propósitos y problemas de
investigación.
57
INVESTIGACIÓN: IA GENERATIVA EN EL TRABAJO
La evidencia demuestra que los grandes modelos de lenguaje logran reducir significativa-
mente el tiempo necesario para llevar a cabo una amplia gama de tareas. La eficiencia pro-
medio del 77% en los tiempos requeridos para realizar 83 tareas, destacan la capacidad de
estas herramientas para optimizar procesos y aumentar la eficiencia operativa en diversos
contextos laborales.
Esta transformación requiere un cambio en la organización del trabajo, con nuevas estrategias
y enfoques, donde la adaptación y la integración de la IAGen se convierten en factores clave
para el desarrollo y la eficiencia laboral. Este cambio requiere una selección cuidadosa de
tareas y procesos sobre los cuales aplicar IAGen y la adaptación de estrategias de uso a las
necesidades específicas de cada organización.
La implementación de ChatGPT e IAGen implica una exigencia clara para que los trabajadores
desarrollen nuevas habilidades. Entre las competencias más valoradas se encuentran la
interacción efectiva con estas tecnologías, la creación de prompts precisos y estandarizados
como templates, la supervisión, el juicio crítico para evaluar los resultados generados y
la adaptabilidad para incorporar estas herramientas en la rutina de trabajo. La educación
desempeña un papel fundamental en la adquisición de estas habilidades, destacando la
importancia del aprendizaje continuo y la actualización de conocimientos para aprovechar
al máximo las oportunidades y beneficios que ofrecen las nuevas tecnologías en general,
y la IAGen en particular. Por último, la efectividad de estas herramientas depende en gran
medida de la habilidad de los usuarios para interactuar y complementarlas, lo que subraya
la necesidad de un enfoque colaborativo entre la inteligencia humana y artificial.
58
59
5
PRÓXIMOS
PASOS
INVESTIGACIÓN: IA GENERATIVA EN EL TRABAJO
Los próximos pasos consisten en probar en distintas áreas de desarrollo, los prompts como
templates. Consideramos que los prompts que se crean para optimizar ciertas tareas y
subtareas, pueden convertirse en templates, aplicables a próximas tareas similares. El objetivo
consiste en obtener prompts estandarizados a los que se puede recurrir rápidamente, en
tareas similares y repetitivas, lo cual evita la actividad humana de diseñar un nuevo prompt
cada vez que se debe realizar una tarea similar.
De las pruebas realizadas, surge que los prompts como templates tienen el potencial para
aumentar aún en mayor medida la eficiencia. Obsérvese los resultados alcanzados en tres
tareas.
60
INVESTIGACIÓN: IA GENERATIVA EN EL TRABAJO
61
INVESTIGACIÓN: IA GENERATIVA EN EL TRABAJO
4
• Se realizaron 2 pruebas hasta descubrir un caso de uso con Total de tiempo
un prompt que permitía llegar a un resultado óptimo.
• Se realizaron 6 pruebas para convertir el prompt óptimo en un HORAS
DE TRABAJO
template. Este trabajo insumió 3 horas.
• Se destinaron 16 minutos y 30 segundos para llegar al prompt
optimizado como template.
15
• Si se tarda 1 hora sin el uso de ChatGPT y se realizan 30
En 1 mes se ahorran
contestaciones de demanda al mes, se requieren 30 horas de
trabajo humano para elaborar los argumentos. HORAS
Y MEDIA
• Si se tardan 29 minutos en elaborar los argumentos con
ChatGPT (actividad humana + uso de ChatGPT) y se realizan
30 contestaciones de demanda al mes, se requieren 14 horas y
media.
El sacrificio que implicaron las 4 horas de trabajo con ChatGPT, se recuperan en alrededor
de 4 días.
• Si se tarda 1 hora sin el uso de ChatGPT y se realizan 330
170
En 1 año se ahorran
contestaciones de demanda al año, se requieren 330 horas de
trabajo humano para elaborar los fundamentos.
• Si se tardan 29 minutos en elaborar los fundamentos con
ChatGPT (actividad humana + uso de ChatGPT) y se realizan
330 contestaciones de demanda al año, se requieren 159 horas HORAS Y MEDIA
y media.
62
INVESTIGACIÓN: IA GENERATIVA EN EL TRABAJO
3
• Se realizaron 2 pruebas hasta descubrir un caso de uso con un
Total de tiempo
prompt que permitía llegar a un resultado óptimo.
• Se realizaron 5 pruebas para convertir el prompt óptimo en un
HORAS
template. Este trabajo tomó 2 horas y 45 minutos. Y 45 MIN.
Mensual
5
• Si se tarda 30 minutos sin el uso de ChatGPT y se realizan 30
En 1 mes se ahorran
contestaciones de demanda al mes que requieren la mejora de
los argumentos, se requieren 15 horas de trabajo humano para
elaborar los argumentos. HORAS
El sacrificio que implicaron las 3 horas y 45 minutos de trabajo con ChatGPT, se recuperan en alrededor de 10 días.
63
INVESTIGACIÓN: IA GENERATIVA EN EL TRABAJO
Anual
55
• Si se tardan 30 minutos sin el uso de ChatGPT y se realizan
En 1 año se ahorran
330 contestaciones de demanda que requieren mejora de los ar-
gumentos al año, se requieren 165 horas de trabajo humano para
elaborar los fundamentos.
• Si se tardan 20 minutos en mejorar los fundamentos con
ChatGPT (actividad humana + uso de ChatGPT) y se realizan HORAS
330 contestaciones de demanda al año, se requieren 110 horas
y media.
2
Total de tiempo
• Se realizaron 4 pruebas hasta descubrir un caso de uso con un
prompt que permitía llegar a un resultado óptimo y convertirlo en
un template. Este trabajo insumió 2 horas. HORAS
DE TRABAJO
• Se destinaron 10 minutos y 30 segundos para llegar al prompt
optimizado como template.
64
INVESTIGACIÓN: IA GENERATIVA EN EL TRABAJO
293
• Si se tardan 30 minutos sin el uso de ChatGPT y se realizan 100 En 1 mes se ahorran
conclusiones de evaluaciones al mes, se requieren 300 horas de
trabajo humano.
• Si se tardan 4 minutos con ChatGPT (actividad humana + uso
de ChatGPT) y se realizan 100 conclusiones de evaluaciones al
mes, se requieren 7 horas de trabajo humano. HORAS
Con las pruebas ya realizadas en esta nueva fase de la investigación, hemos alcanzado los
siguientes hallazgos:
65
INVESTIGACIÓN: IA GENERATIVA EN EL TRABAJO
67
68
IANEXOS.
RESULTADOS
ANEXO I
ANEXO I. Resultados
Especificamos, para cada una de las 83 tareas analizadas, el tiempo necesario para su
ejecución sin y con IAGen.
1. Administración Pública
69
ANEXO I
• Análisis de oferta
Tareas sobre las cuales se • Proceso de selección con Análisis de 50 CV para posición
Asesor Legal Sr
efectuaron las mediciones
• Supervisión de proyecto de acto administrativo de cese
retroactivo del impuesto a los ingresos brutos
• Dictamen jurídico
Eficiencia 70%
Alta: 2 tareas
Nivel de complejidad Media: 9 tareas
Baja: 2 tareas
Automatizable: 1 tarea
Grado de automatización
Semiautomatizable: 12 tareas
Alto: 3
Juicio humano requerido
Medio: 10
Alta: 7 tareas
Repetitividad Media: 3 tareas
Baja: 3 tareas
Asistencia: 11 tareas
Incidencia de la IAGen
Sin asignar: 2 tareas
Alta: 75%
Eficiencia según el nivel
Media: 74%
de complejidad Baja: 87%
Alta: 87%
Eficiencia según el nivel
Media: 75%
de repetitividad Baja: 16%
70
ANEXO I
2. Justicia
Las pruebas que se encuentran a continuación fueron realizadas desde diferentes poderes
judiciales de Argentina. Concretamente por equipos conformados por jueces, funcionarios y
funcionarias de las provincias de Mendoza, San Juan, Tierra del Fuego, Misiones, Tucumán,
Buenos Aires y la Ciudad Autónoma de Buenos Aires.
71
ANEXO I
Eficiencia 62%
Alta: 11 tareas
Nivel de complejidad Media: 14 tareas
Baja: 4 tareas
Automatizable: 10
Grado de automatización Semiautomatizable: 8
No automatizable: 1
Alto: 17
Medio: 2
Juicio humano requerido
Bajo: 8
Sin asignar: 2
Alta: 16 tareas
Media: 7 tareas
Repetitividad
Baja: 4 tareas
Sin asignar: 2 tareas
Asistencia: 19 tareas
Complemento: 3 tareas
Incidencia de la IAGen
Sustitución: 3 tareas
Sin asignar: 4 tareas
Alta: 77%
Eficiencia según el nivel
Media: 38%
de complejidad Baja: 28%
Alta: 65%
Eficiencia según el nivel
Medio: 57%
de juicio humano requerido Bajo: 44%
Alta: 45%
Eficiencia según el nivel
Media: 71%
de repetitividad Baja: 67%
72
ANEXO I
Eficiencia 68%
73
ANEXO I
Alta: 9 tareas
Nivel de complejidad Media: 12 tareas
Baja: 6 tareas
Automatizable: 8
Grado de automatización Semiautomatizable: 11
No automatizable: 8
Alto: 15
Juicio humano requerido Medio: 9
Bajo: 3
Alta: 11 tareas
Repetitividad Media: 5 tareas
Baja: 11 tareas
Asistencia: 10 tareas
Complemento: 9 tareas
Incidencia de la IAGen
Sustitución: 7 tareas
Sin asignar: 1 tarea
Alta: 73%
Eficiencia según el nivel
Media: 62%
de complejidad Baja: 50%
Alta: 71%
Eficiencia según el nivel
Media: 57%
de juicio humano requerido Baja: 44%
Alta: 55%
Eficiencia según el nivel
Media: 63%
de repetitividad Baja: 72%
4. Traducción
Eficiencia 99,9%
74
ANEXO I
Alto: 1
Juicio humano requerido
Medio: 1
Alta: 1 tarea
Repetitividad
Media: 1 tarea
5. Educación
Eficiencia 51%
Alta: 1 tarea
Nivel de complejidad
Media: 3 tareas
Asistencia
Incidencia de la IAGen
Complemento: 2 tareas
75
ANEXO I
b. Optimización de tiempos
A continuación, se analiza el tiempo requerido para completar la tarea sin y con el uso de
herramientas de IAGen. Se desprende además el nivel de eficiencia alcanzado en cada caso.
1. Administración Pública
Redacción de un contrato
administrativo
60 6 90%
Redacción de un contrato
administrativo
60 6 90%
Redacción de un contrato
administrativo
60 3 95%
Redacción de un contrato
administrativo
60 2 97%
76
ANEXO I
2. Justicia
Analisis y comparacion
de escrito
20 25 -25%
Confronte de oficios
(segunda prueba) 10 10 0%
77
ANEXO I
Confronte de oficios
(segunda prueba) 10 10 0%
Confronte de oficios
(segunda prueba) 10 10 0%
Redacción de una demanda de daños
y perjuicios por responsabilidad estatal 60 23.25 61%
en contexto de violencia de género
78
ANEXO I
Elaboración de contrato
de locación 30 17 43%
Redacción de carta
documento laboral 20 9 55%
Elaboración de mandamiento
de intimación de pago 15 7 53%
Análisis de Resolución
Tributaria Recibida 60 20 67%
Revisión de procedimiento
de Conflicto de Interés 30 6 80%
Extracción preliminar de
obligaciones de un contrato 250 120 52%
Armado de una carta contractual
estándar (notificar un Evento, generar 30 2 93%
una reserva contractual)
Redacción de un descargo
administrativo 5 45 -800%
79
ANEXO I
80
ANEXO I
4. Traducción
5. Educación
Selección de la Unidad
del Programa a Trabajar 7 8 -14%
Seleccionar la actividad
práctica adecuada 2 2 0%
Planificar la actividad
práctica seleccionada 35 10 71%
6. Investigación
Definición de un proyecto
de investigación
80 570 -613%
81
ANEXO I
A continuación se listan las tareas de complejidad alta sobre las cuales se efectuaron las
mediciones:
Análisis de quitas
Revisión de procedimiento
de Conflicto de Interés
Identificar controles a realizar para verificar
el cumplimiento de acuerdos de niveles de
servicios en contratos con proveedores
Estudio jurídico /
Extracción preliminar de obligaciones Alta
área de legales
de un Contrato
Elaboración de demanda
82
ANEXO I
A continuación se listan las tareas de complejidad alta sobre las cuales se efectuaron las
mediciones:
83
ANEXO I
Análisis de Ofertas
Realización de un testimonio
Elaboración de mandamiento
de intimación de pago
84
ANEXO I
85
ANEXO I
Traducción Media
Primer borrador de traducción de un texto
de 15000 palabras
A continuación se listan las tareas de complejidad baja sobre las cuales se efectuaron las
mediciones:
86
ANEXO I
Estudio jurídico
Redacción de carta documento laboral Baja
/ área de legales
87
ANEXO I
A continuación se listan las tareas de alto nivel de juicio humano sobre las cuales se
efectuaron las mediciones:
Juicio humano
Área / Sector Tarea
requerido
Dictamen Jurídico
Análisis de quitas
88
ANEXO I
Estudio jurídico /
Análisis de Resolución Tributaria Recibida Alto
área de legales
Elaboración de demanda
89
ANEXO I
A continuación se listan las tareas de medio nivel de juicio humano sobre las cuales se
efectuaron las mediciones:
90
ANEXO I
Juicio humano
Área / Sector Tarea
requerido
Análisis de ofertas
Realización de un testimonio
91
ANEXO I
A continuación se listan las tareas de bajo nivel de juicio humano sobre las cuales se
efectuaron las mediciones:
92
ANEXO I
Juicio humano
Área / Sector Tarea
requerido
Estudio jurídico /
Confección de oficio judicial Bajo
área de legales
Justicia Bajo
Confronte de oficios (segunda prueba)
93
ANEXO I
1. Repetitividad alta
A continuación se listan las tareas de repetitividad alta sobre las cuales se efectuaron las
mediciones:
Nivel
Área / Sector Tarea
de repetitividad
Dictamen Jurídico
Estudio jurídico /
Análisis de Acta Recibida por una Infracción Alta
área de legales
Tributaria - Comparación entre dos actas
similares ( misma infracción) pero que versaban
sobre distintos hechos
94
ANEXO I
Realización de un testimonio
Estudio jurídico /
Elaboración de contrato de locación
área de legales Alta
de empresas
Redacción de email. (Contenido:
Información del estado de la causa para
el cliente.) Redacción de demanda por
incumplimineto contractual en el marco de
una relación de consumo (Planes de ahorro
Automotor)
95
ANEXO I
2. Repetitividad media
A continuación se listan las tareas de repetitividad media sobre las cuales se efectuaron las
mediciones:
96
ANEXO I
Nivel
Área / Sector Tarea
de repetitividad
Análisis de Ofertas
Elaboración de demanda
Estudio jurídico /
área de legales Redacción del informe de quitas Media
de empresas
97
ANEXO I
3. Repetitividad baja
A continuación se listan las tareas de repetitividad media sobre las cuales se efectuaron las
mediciones:
Nivel
Área / Sector Tarea
de repetitividad
Análisis de Ofertas
98
ANEXO I
Análisis de quitas
Estudio jurídico /
Pliego de posiciones para la redacción de
área de legales
demanda por incumplimineto contractual
Baja
de empresas en el marco de una relación de consumo
(Planes de ahorro Automotor)
99
ANEXO I
100
101
II
ANEXO
ANEXO II
ANEXO II
Administración Pública
Luego de que el equipo de UBA IALAB definió los objetivos y alcances de la investigación,
en el ámbito de la Dirección General y Técnica Administrativa y Legal del Ministerio
Desarrollo Económico y Producción de la Ciudad de Buenos Aires, se convocó a un equipo
interdisciplinario de colaboradores voluntarios (7 personas en total).
Las áreas de expertise sobre las que se realizaron las pruebas fueron: Compras y
Contrataciones, Legal y Recursos Humanos. Las tareas seleccionadas fueron: “Análisis de
Ofertas”, “Control Legal de Convenios” y “Proceso de Selección con Análisis de CVs para
posición determinada”.
102
ANEXO II
Con los primeros resultados los voluntarios fueron comprendiendo que podía ser una
herramienta colaborativa o de soporte a la hora de desarrollar sus tareas, mostrandose
alertados en los casos en los que la herramienta reemplaza o sustituye la tarea humana.
Como etapa final, luego de una primera devolución al equipo de IALAB se llevó a cabo una
revisión exhaustiva de la matriz. Se verificó la coherencia de la información y se corrigieron
errores de interpretación en términos generales. Además, se aseguró la precisión y
consistencia de los datos presentados, así como la calidad del contenido en general.
Justicia
Las pruebas de identificación del objeto de una demanda de astreintes y la identificación
de agravios en un recurso de inconstitucionalidad de un caso de cesantía se realizaron en
la Fiscalía General Adjunta en lo Contencioso, Administrativo, Tributario y de Relaciones del
Consumo del Ministerio Público Fiscal de la Ciudad Autónoma de Buenos Aires.
Las pruebas consistieron en pedirle a ChatGPT por medio de distintos prompts que realice
un análisis exhaustivo de una demanda, en un caso, y que identifique cuál era su objeto de
forma detallada y precisa. En otro caso, se le solicitó a la herramienta que analice un recurso
de inconstitucionalidad e identifique sus agravios.
103
ANEXO II
En ambos casos las pruebas realizadas arrojaron resultados exitosos, cumpliendo con los
objetivos esperados y sin tener que rehacer ninguno de los prompts iniciales.
Por usar sólo uno de los dos casos como ejemplo, el tiempo de realización de la lectura
humana de un recurso de inconstitucionalidad para identificar correctamente los agravios
planteados es de, aproximadamente, 25 minutos. Con esta herramienta de IAGen, ese
tiempo se vio acortado a 2 minutos con 30 segundos, es decir, un 90% de optimización del
tiempo.
Traducción
Las pruebas de armado de glosario y el borrador de traducción de un texto de 15.000
palabras fueron realizadas por una traductora de inglés, quien colaboró con el Laboratorio
a tales fines.
Las pruebas consistieron en pedirle tanto a MateCat561como a ChatGPT —en este caso, por
medio de distintos prompts— que realicen un análisis de un texto, en un caso, y extraigan
distintos términos para integrar un glosario. En otro caso, se les solicitó a las herramientas
que analicen un texto y lo traduzcan.
Para las dos pruebas realizadas se tomaron como tiempo estimado de la realización de las
tareas, unos 2.400 minutos (40 horas). Con estas herramientas de IA generativa, ese tiempo
se vio acortado a 2 minutos, es decir, alcanzando casi un 100% de optimización del tiempo.
Por lo que podemos concluir en que son herramientas que sirven de complemento.
56 MateCat es un software libre de traducción basado en la limitación de segmentos dentro del proyecto de traducción y la máxima optimización de
la repetición de palabras.
104
105