100% encontró este documento útil (8 votos)
2K vistas

Machine Learning

El documento presenta una breve historia del uso de datos y análisis estadísticos en las empresas, desde el uso inicial de datos estructurados y reportes hasta la era actual del Big Data y el machine learning. Explica que originalmente los datos se usaban solo para propósitos específicos como ventas históricas, pero ahora se interrelacionan e interconectan en grandes volúmenes para tomar decisiones en tiempo real. También define el machine learning como una rama de la inteligencia artificial enfocada en permitir que las máquinas aprendan, y explica que

Cargado por

Maria Lobo
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
100% encontró este documento útil (8 votos)
2K vistas

Machine Learning

El documento presenta una breve historia del uso de datos y análisis estadísticos en las empresas, desde el uso inicial de datos estructurados y reportes hasta la era actual del Big Data y el machine learning. Explica que originalmente los datos se usaban solo para propósitos específicos como ventas históricas, pero ahora se interrelacionan e interconectan en grandes volúmenes para tomar decisiones en tiempo real. También define el machine learning como una rama de la inteligencia artificial enfocada en permitir que las máquinas aprendan, y explica que

Cargado por

Maria Lobo
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
Está en la página 1/ 26

29

ÍNDICE
CAPÍTULO PÁGINA

01_ Presentación 4

02_
01— Estadística, Data Mining, Analytics
y Machine Learning: un poco de historia 5
03_
01.1— ¿En qué consiste el Machine Learning? 6

04_ 01.2— ¿Por qué funcionan los algoritmos


de Machine Learning? 8
05_
02 Machine Learning & Big Data:
06_— más allá de la moda 10

07_
03— ¿Cómo asegurar que la inversión en Machine
Learning y Big Data sea altamente rentable? 14
08_
04 Requisitos para obtener valor diferencial 17
09_—
05— Los nuevos profesionales 20

10_ Conclusiones
06— 21

07— Glosario
11_ 23

08— Bibliografía
12_ 25

09— Sobre los autores 26


13_
14_

3
PRESENTACIÓN
La irrupción de nuevas tecnologías aplica- Seguidamente, los autores explican me-
das al análisis de datos puede arrastrar a diante experiencias reales las fórmulas
las empresas a una sensación de vértigo. más acertadas para que la organización
No hay motivo real para que ello ocurra. haga un uso eficiente de la tecnología Big
Las empresas vienen usando información Data y el Machine Learning. También se
para optimizar sus resultados desde mu- advierte que la acumulación masiva de
chas décadas atrás, si bien es cierto que datos no proporciona, por sí misma, nin-
los procesos están ganando en compleji- gún beneficio para la empresa: el directivo
dad: es posible recoger muchos más datos debe decidir qué datos interesan realmen-
y más variados en un espacio de tiempo te y descartar aquellos que no aportan
sensiblemente menor. Esta dinámica obli- valor. Con esta finalidad, el presente
gará a los directivos a tomar decisiones en informe recopila también algunas reco-
tiempo real y predecir un nuevo escenario mendaciones para llevar a cabo una apli-
al que ningún profesional podrá permane- cación eficiente del sistema Big Data y del
cer ajeno. Machine Learning, así como los requisitos
que se precisan para que la implantación
Nuestro propósito es que este informe sea de ambas tecnologías sea exitosa y aporte
un instrumento útil para los directivos a la valor añadido al negocio.
hora de enfrentarse a los retos que plan-
tea la Inteligencia Artificial y que puedan Los perfiles -técnicos y directivos- que se
obtener el máximo valor para el negocio a necesitan para desarrollar una solución de
partir de las herramientas que esta nueva Machine Learning constituyen, igualmente,
tecnología nos proporciona. También pre- un aspecto fundamental para garantizar el
tende indicar, a través de una serie de re- éxito del sistema. El documento recoge las
comendaciones y consejos, cómo hacer un skills más importantes que deben tener
uso eficiente de las mismas, consiguiendo ambos perfiles para un buen uso de esta
un rendimiento óptimo desde el punto de tecnología.
vista de la gestión del negocio.
El cierre del informe “Machine Learning,
El primer capítulo de este documento hace Inteligencia Artificial y Big Data. Lo que
un repaso a cómo las empresas, histó- todo directivo debe saber” lo protagonizan
ricamente y en los años recientes, han las conclusiones que pueden extraerse del
utilizado información y datos para mejorar documento, evidenciando que la aplicación
sus objetivos comerciales. Asimismo, hace de una solución de Big Data y Machine
referencia a la evolución de la aplicación Learning es completamente necesaria
de estos datos: cómo pasaron de ser para el negocio.
meros registros, a utilizarse para mejorar Xavier Gangonells
el negocio. Director general de AED

4
Como expertos en minería de datos y aprendizaje
automático, hemos tenido que explicar a profesio-
nales de otras disciplinas, en numerosas situa-
ciones, en qué consisten estos conceptos y cómo
podrían incorporarlos en sus compañías. Con este
artículo esperamos haberlo logrado: conectar con
el negocio y hablar su mismo idioma es nuestra
especialidad.

Nuestro objetivo es acercar la experiencia que


atesoramos a los responsables de áreas de negocio
con inquietudes similares; ayudarles ante la difícil
tesitura de tener que decidir cómo llevar a cabo la
transformación digital de sus compañías en la que
se ha vuelto indispensable incorporar el aprendiza-
je automático en sus procesos y decisiones.

1. ESTADÍSTICA, DATA MINING, ANALYTICS Y


MACHINE LEARNING: UN POCO DE HISTORIA

Al principio eran datos y, después, su transaccional. Ya no se trata solo de los Después, en el menor tiempo posible,
análisis e interpretación. Un ordenador reportes de las ventas del último mes querrá medir el impacto y la respuesta de
de mesa, herramientas estadísticas, por tienda y SKU (código de artículo), los consumidores.
reportes básicos y un grupo de expertos sino que es indispensable conocer las
era suficiente para tomar decisiones ventas de ayer por SKU, tienda y cliente. La conjunción tiempo, información y ex-
operativas. Los directores de Marketing y Y no solo eso: quién es mi cliente, con pectativas de los clientes exige un enfo-
planificadores de la demanda, para anti- qué frecuencia compra, qué anuncios le que más allá de un grupo de expertos que
cipar el volumen de ventas del siguiente agradan, dónde vive y cuántos hijos tiene. toman decisiones en base a su experien-
trimestre o el impacto que tendría una Y aún más: qué tiempo hacía cuando cia e intuición. Ya no alcanza la potencia
nueva promoción, únicamente se valían realizó la compra y cómo circulaba el de un ordenador de mesa y ni siquiera la
de informes mensuales que confirmasen tráfico por las carreteras. Y también: de un servidor para procesar los grandes
su intuición. a qué precio vendían los competidores volúmenes de información. Ya no solo
un producto similar y qué promociones gestionamos datos estructurados como
Así, el uso de los datos se circunscribía estaban disponibles. nombres, volúmenes de venta y fechas;
únicamente al ámbito en el que eran la información se captura en comentarios
creados: las ventas históricas explicaban En definitiva, los datos dejan de ser un de texto por parte de clientes o perfiles
las futuras, el tiempo previsto determi- puro registro y reflejo de las activida- técnicos, mediante mensajes grabados,
naba si era conveniente abrigarse o salir des de negocio para interrelacionarse imágenes y vídeos que es indispensable
con paraguas y las reclamaciones de e interconectarse; mientras, el tiempo interpretar. En dos palabras: Big Data.
garantías se utilizaban para reembolsar adquiere una nueva dimensión: prima
a los agentes responsables de la repara- la inmediatez en la toma de decisiones. La definición de Big Data no puede
ción de productos. El director de Ventas ya no solicita un limitarse a su simple traducción literal
informe mensual. Quiere saber qué pro- como “grandes datos”. Tiene un alcance
Con el tiempo, los datos capturados se moción lanzar y sobre qué producto, qué superior y podríamos sintetizarlo en las 3
multiplican y el fin deja de ser puramente estrategia usar y durante cuánto tiempo. V que los definen.

5
“Los datos dejan de ser un puro
registro y reflejo de las activi-
dades de negocio para interre-
lacionarse e interconectarse;
mientras, el tiempo adquiere
una nueva dimensión: prima la
inmediatez en la toma de deci-
siones”

1.1 ¿En qué consiste el Machine Learning?


El Machine Learning es una rama de Ventas de una empresa retail del país
la Inteligencia Artificial enfocada al sabe que, durante las primeras semanas
desarrollo de técnicas que permitan del periodo estival, el volumen de venta
Las 3 V del Big Data el aprendizaje de las máquinas. Para de las camisetas de manga corta supone
saber cómo funciona y qué utilidad tiene el 40% del total. Conoce el impacto que
• Velocidad: rapidez en el almace- esta disciplina, a continuación, ilustra- tiene el clima, también el del precio y el
namiento, transmisión y procesa- mos, a través de algunos ejemplos, la de los productos de la competencia. Por
miento. importancia del Machine Learning en la eso, decide enviar más mercancía a las
• Variedad: tipos (estructurados, productividad de las empresas. tiendas.
sonido, imagen, texto) y fuentes
(internas, externas). El año anterior ocurrió precisamente
• Volumen: cantidad masiva de lo contrario: la temporada de verano se
El comportamiento
datos. inició con temperaturas bajas, por lo que
automático las ventas de un producto similar a las
camisetas de manga cortan se atrasaron.
Es acompañado de soluciones de Caso 1: Empresa retail japonesa El director de Ventas decidió potenciar la
Machine Learning cuando Big Data La temporada de verano en Japón se ha venta de camisetas de manga larga con
adquiere todo su valor. adelantado unos 10 días. El director de una promoción, de modo que consiguió

6
Los modelos
mejorar sus resultados un 20% a la vez matemáticos
que se incrementó la actividad de los
clientes en redes sociales con relación a De la misma manera que los expertos
estas prendas. aprenden de manera intuitiva y toman la
decisión que consideran más adecuada,
los modelos matemáticos son capaces
Caso 2: Planta de fabricación de maqui- de proveer información útil. La simu-
naria agrícola lación de toma de decisiones con datos
El ingeniero de una planta de fabricación históricos nos dará el nivel de confianza
“El comportamiento automático de maquinaria agrícola reconoce que los esperado; de modo que la intuición de los
consiste en utilizar la infor- nuevos componentes incorporados en expertos se transforma en datos cuanti-
mación histórica almacenada el último modelo de uno de sus produc- ficados.

internamente o procedente de tos no se comportan de acuerdo con las


expectativas de la compañía. En el caso de la empresa retail japonesa,
fuentes externas y aprender,
los modelos matemáticos podrían ayu-
con el fin de tomar decisiones
Cuenta con datos históricos que indican darnos a estimar el volumen de ventas
inteligentes”
el nivel de fallo de nuevos componentes al inicio de la temporada o a ajustar los
durante las primeras semanas por tiem- pronósticos en función del grado de sa-
po de uso (horas/kilómetros), por piezas tisfacción reflejado por los clientes en las
de repuesto, clima y geografía. A su vez, redes sociales.
conoce las tendencias en términos de
costes por máquina y fallos por máquina En el caso del fabricante de maquinaria
durante el período de garantía. Desde agrícola, podrían contribuir a despejar los
su experiencia, el nivel de fallos supera factores vinculados con el fallo. Podrían
el volumen esperado según el tiempo de estimar si los nuevos componentes
uso, lo que le lleva a pensar en que está superan la ratio de fallos históricos o
frente a un fallo epidémico emergente. la magnitud esperada en términos de
coste y volumen, teniendo en cuenta los
En ambos casos, tanto el director de Ven- equipos expuestos al riesgo y sus horas
tas como el ingeniero, nuestros expertos, de uso. Conociendo las causas, sería más
contaban con conocimientos generados factible encontrar las soluciones.
en base a su experiencia. Ambos han
desarrollado lo que se conoce como Ambos son ejemplos de aprendizaje
“comportamiento automático”: utilizar automático sin necesidad de intervención
la información histórica almacenada humana: búsqueda de patrones de com-
internamente o procedente de fuentes portamiento basados en datos históricos
externas y aprender con el fin de tomar para aplicarlos en nuevas situaciones
decisiones inteligentes. desconocidas.

7
1.2 ¿Por qué funcionan los algoritmos de Machine Learning?

En cualquier proceso analítico, el objetivo En definitiva, los algoritmos de Machine bastante relativa-, sino de su correcta
principal es extraer información Learning resultan en gran medida efica- estratificación. Y, muy especialmente, de
accionable del conjunto de datos. Es ces para abordar problemas de segmen- la correcta identificación de las fuentes
decir, información objetiva y operacio- tación, clasificación e incluso predicción. de variación, así como de los respectivos
nalmente válida, ya sea para la toma de Un ejemplo de ello, en una de las áreas factores de ponderación.
decisiones o para el control de procesos en las que, probablemente, vamos a ser
en tiempo real. testigos de grandes avances, es en la En este sentido, los algoritmos de
comunicación: tales como los sistemas Machine Learning son capaces de extraer
La característica fundamental de los de recomendación que muchos de noso- patrones de variación de manera mucho
algoritmos de Machine Learning es su tros utilizamos habitualmente en tiendas más eficiente que los considerados
extraordinaria capacidad para extraer online, apps de agregación de noticias u “métodos clásicos”, basados en la
patrones que se escapan a la mayoría otras aplicaciones. estadística paramétrica. Los algoritmos
de métodos aplicados históricamente. no asumen ningún tipo de prerrequisito
Además, destaca su versatilidad para Por otro lado, Machine Learning puede previo, ya sea normalidad o potencia de la
trabajar con información gráfica, soni- contrarrestar de manera eficiente uno de muestra.
dos o lenguaje natural, entre otros, y de los principales problemas no resueltos
generar resultados de la misma natura- en Big Data: el sesgo. Como bien saben En sectores maduros en los que la ope-
leza. Son altamente eficientes los analistas encargados de realizar rativa empresarial o industrial depende
con series de datos complejas y con encuestas electorales, su acierto no solo directamente o está estrechamente
múltiples escalas o factores de varia- depende del tamaño de la muestra -de vinculada con el resultado de algún tipo
ción. hecho, este suele tener una importancia de modelo predictivo, una mejora signifi-

8
cativa en dicho resultado en términos de
alcance o precisión representa igualmen- Recomendaciones para directivos:
te un impacto económico que hay que
valorar. En muchos casos, la aplicación • La adopción del Machine Lear-
de modelos de Machine Learning consti- ning en ningún caso implica romper
tuye una ventaja competitiva relevante a con el pasado y empezar de cero,
considerar. sino que combina toda la experiencia
y el conocimiento previo del negocio
Sin embargo, a pesar del inmenso aba- con los nuevos datos recogidos para
nico de aplicaciones que ofrece esta tec- que, una vez tratados con los proce-
nología y del avance que supone con res- dimientos adecuados, aporten nueva
pecto al pasado más reciente, estamos información más completa y útil.
todavía lejos de poder confiar ciegamente
en ella. Para crear y alimentar las varia-
bles que formarán parte de los algorit-
“La característica fundamental mos y poder ponderarlas adecuadamente

de los algoritmos de Machine durante el proceso de entrenamiento,


aún resulta imprescindible contar con un
Learning es su extraordinaria “Para crear y alimentar las
conocimiento previo del contexto y de las
capacidad para extraer patro- variables que formarán parte de
dinámicas de los procesos de negocio. Y
nes que se escapan a la mayoría los algoritmos y poder ponde-
no solo eso, sino que, además, algunas
de métodos aplicados históri- rarlas adecuadamente durante
de las principales áreas de investigación
camente. Además, destaca su que se desarrollan en la actualidad son el proceso de entrenamiento,
versatilidad para trabajar con precisamente en el ámbito de los algorit- aún resulta imprescindible con-
información diversa” mos semi-supervisados y del Aprendizaje tar con un conocimiento previo
por Refuerzo (Reinforcement Learning), del contexto y de las dinámicas
basado en funciones de recompensa. de los procesos de negocio.”

En resumen, sigue siendo necesario


contar con el suficiente conocimiento del
negocio, casi tanto como conocimiento y
experiencia en el campo de la analítica,
para poder identificar qué tipo de algo-
ritmos son los más apropiados en cada
caso, en términos de eficiencia, tiempo
de cálculo y requerimientos.

9
2. MACHINE LEARNING & BIG DATA:
MÁS ALLÁ DE LA MODA

¿Por dónde empezar? Estudiar casos semejante con MCT (Microsoft Cognitive
de empresas que ya han recorrido un Toolkit, conocido anteriormente como
primer trecho del camino puede ayudar a CNTK); Amazon difundió los últimos
orientar la aplicación de esta tecnología avances en MXNet1 y Facebook presentó
en una empresa. Por suerte, varios gi- no uno sino dos proyectos: Torch y Caffe.
gantes tecnológicos han compartido sus Por otro lado, la propia comunidad OS,
primeras experiencias y conclusiones con bajo el paraguas de la Apache Software
el resto de la comunidad. Foundation, da cobertura a un gran nú-
mero de iniciativas independientes, tanto
Si bien es cierto que la evolución del a nivel de tecnologías Big Data como en
conocimiento y el desarrollo tecnológico Inteligencia Artificial.
no suelen seguir procesos lineales, sino
que alternan periodos de efervescencia El hecho de liberar el código, aunque sea
y rápido desarrollo con otros de imple- bajo diferentes tipos de licencia, no hace
mentación y despliegue tecnológico, más que favorecer y alimentar a escala
estos años bien podrían considerarse global la investigación por parte de los
los del Aprendizaje Automático (Machine diferentes grupos de desarrolladores
Learning). Años en los que esta disciplina alrededor del mundo, ya pertenezcan
se incorporó en los planes de desarrollo a grandes corporaciones o se trate de
tecnológico de muchas compañías. genios solitarios.

En los últimos tiempos, hemos conoci- Tampoco resulta excepcional que algunos
do (y seguiremos conociendo) un gran desarrolladores afiliados a grandes
número de noticias relacionadas con la empresas tecnológicas den rienda suelta
Inteligencia Artificial y, en concreto con a su creatividad en su tiempo libre,
el Machine Learning. Distintas empresas liderando o, cuanto menos, aportando su
líderes han aprovechado para liberar granito de arena a algunos de estos pro-

1. Vogels, W. (2016). MXNet - Deep en la comunidad Open Source (OS) sus yectos. Sea el caso que sea, la mayoría
Learning Framework of Choice at AWS. respectivos avances en este área. de licencias OS obligan a los desarrolla-
2018, de All Things Distributed Sitio dores a difundir, asimismo, sus avances y
web: https://www.allthingsdistributed. Sin ir más lejos, Google presentó Ten- modificaciones, por lo que la masa crítica
com/2016/11/mxnet- default-framework- sorFlow; Microsoft, siempre amante aumenta exponencialmente acelerando
deep-learning-aws.html de los cambios de nombre, realizó algo todavía más el proceso.

10
Learning requieren grandes volúmenes
de datos para entrenar y calibrar los
algoritmos, volúmenes mayores en varios
órdenes de magnitud que los requeridos
¿Por qué ahora? Machine Learning tienen su origen varias para satisfacer los criterios estadísticos y
décadas atrás (algunos, incluso, en los niveles de confianza habituales.
Una de las preguntas que surgen ante años sesenta del siglo pasado)?
este aluvión de noticias relacionadas Por otro lado, las herramientas y tecno-
con Machine Learning es: ¿por qué A diferencia de los métodos clásicos logías necesarias para manejar actual-
su desarrollo y aplicación despuntan basados en la estadística multi-paramé- mente los ingentes volúmenes de datos y
precisamente ahora, a pesar de que los trica, aquella en la que los datos reales la mayoría de los algoritmos de Machine
fundamentos teóricos de la mayoría de responden a distribuciones conocidas, Learning son computacionalmente tan
los algoritmos de Inteligencia Artificial y la mayoría de algoritmos de Machine exigentes, tanto, que requieren de uni-

Análisis de Temas de 1.000 tweets sobre Machine Learning

A través de los siguientes gráficos (bajo estas líneas y en la página siguiente) se muestra la relevancia del interés de estos temas
objeto del informe, medidos a través de las búsquedas o menciones en diferentes redes sociales

Selected Topic 1 Previous Topic Next Topic Clear Topic Slide to adjust relevance metric:2 =
A=1 0.0 0.2 0.4 0.6 0.8 1.0

Intertopic Distance Map (via multidimensional scalingh) Top-30 Most Relevant Terms for Topic 1 (26.8% of tokens)
0 100 200 300 400 500
PC2
drone
robot
use
3 these
5 mind
2 1 machinelearnin
student
autonom
control
trend
deepleam
algorithm
data
insurtech
PC1 releas
rute
latest
top
human
bigdat
way
editor
bigdata
guest
drive
4
ht
will
big
health
Marginal topic distribution finserv

Overall term frecuency


2% Estimated term frecuency winthin the selected topic
5% 1. saliency (term w) = frecuency (w) [sum_t p(t|w)*log(p(t|w/p(t))]for topics t, see Chuang et.al (2012)
2. relevance (term w|topic t)= A*p(w|t)+(1-A)*p(w|t/p(w); see Sievent & Shirley (2014)
10%

Tema 1: drones / robótica / Deep Learning. Fuente: Elaboración propia

11
dades de procesamiento especializadas Por tanto, los factores desencadenantes En los últimos años se han registra-
con altísimos niveles de paralelización del rápido ascenso de las técnicas de do grandes avances; pero, como cabía
(GPUs). Machine Learning son fundamental- esperar, no todo han sido éxitos. Algunos
mente dos. Por un lado, el desarrollo de los fracasos más sonados tienen su
Así, las GPUs hace tiempo que dejaron de tecnológico y el acceso a grandes origen en un exceso de confianza y, por
ser exclusivas de las consolas de video- recursos computacionales a un coste ende, de falta de supervisión en la aplica-
juegos, de donde provienen, para formar asumible, no solo por parte de grandes ción automática de algoritmos.
parte no tan solo de las grandes infraes- empresas. En segundo lugar, la disponi-
tructuras de cálculo y servicios cloud, bilidad de grandes volúmenes de datos, Sin duda, el desarrollo y aplicación de las
sino también de la mayoría de tarjetas necesarios para entrenar adecuada- técnicas de Inteligencia Artificial seguirán
gráficas de altas prestaciones. mente los algoritmos. imparables durante los próximos años.

Selected Topic 4 Previous Topic Next Topic Clear Topic Slide to adjust relevance metric:2 =
A=1 0.0 0.2 0.4 0.6 0.8 1.0

Intertopic Distance Map (via multidimensional scalingh) Top-30 Most Relevant Terms for Topic 1 (14.6% of tokens)
0 50 100 150 200
PC2
tech
next
where
3 fintech
5 whi
2 1 bigdata
blockchain
innovat
announc
healthtech
ar
machineleam
ai
time
PC1 just
miagent
version
now
import
learn
thrill
toolkit
quartz
project
amp
4
guid
requir
drown
abou
Marginal topic distribution develop

Overall term frecuency


2% Estimated term frecuency winthin the selected topic
5% 1. saliency (term w) = frecuency (w) [sum_t p(t|w)*log(p(t|w/p(t))]for topics t, see Chuang et.al (2012)
2. relevance (term w|topic t)= A*p(w|t)+(1-A)*p(w|t/p(w); see Sievent & Shirley (2014)
10%

Tema 2: Big Data / blockchain / innovación. Fuente: Elaboración propia

12
“Los factores desencadenan-
tes del rápido ascenso de las
técnicas de Machine Learning
son fundamentalmente dos:
el desarrollo tecnológico y el Principalmente, en áreas más especia-

acceso a grandes recursos com- lizadas y quizás alejadas de los grandes


titulares, áreas en las que los algoritmos
putacionales a un coste asumi-
puedan resolver problemas de manera
ble, así como la disponibilidad
realmente efectiva y con un alto grado de
de grandes volúmenes de datos,
precisión.
necesarios para entrenar ade-
cuadamente los algoritmos” Solo por nombrar algunos ejemplos
conocidos: ciberseguridad, seguridad
personal, comercio financiero, cuidado Recomendaciones para directivos:
de la salud, marketing personalizado,
recomendaciones y búsquedas on line. • El desarrollo y la aplicación de las
Estos son algunos pocos ejemplos reales, técnicas de IA seguirá imparable duran-
pero hay muchos casos más donde su te los próximos años. No dejes que tu
aplicación con resultados positivos ya es empresa se quede atrás.
una realidad.

13
3. ¿CÓMO ASEGURAR QUE LA INVERSIÓN EN MACHINE
LEARNING Y BIG DATA SEA ALTAMENTE RENTABLE?

Algunas empresas tienden a pensar que, un superordenador, “Pensamiento Pro-


a mayor cantidad de datos, o resultados fundo”, capaz de responder a la eterna
que proporcionan algoritmos, mayor cuestión: “¿cuál es el sentido de la vida?”
valor añadido. Sin embargo, no se trata
de una cuestión de cantidad, sino de la Tras años procesando la información,
relevancia de los datos disponibles para la máquina da una respuesta: “42”. La
los objetivos de negocio. sorpresa de sus creadores es grande, así
que deciden preguntarle qué significado
Preguntas, no solo da- tiene ese número. “Pensamiento Profun-
do” asegura que “42” es la respuesta co-
tos (La importancia de
rrecta, pero que el problema reside en la
un problema de negocio pregunta: ¿cuál es la pregunta correcta?
bien definido)
Esta divertida historia se vuelve anec-
En su famoso libro “La Guía del Autoesto- dótica cuando se traslada al mundo de
pista Galáctico”, Douglas Adams imagina Machine Learning y Big Data y, más en
que una civilización muy avanzada crea general, de Analytics.

14
Es un error común pensar que contar con (asumamos, por un momento, que el fa-
muchos datos y una o más herramientas bricante tiene acceso a datos detallados
que implementan algoritmos de Machine de tickets y al consumo de cerveza de
Learning aportan, por sí mismos, valor al presión a través de sensores). Además,
negocio. se hace con las mejores aplicaciones de
Machine Learning y, simplemente, las
Pero no hay mayor equivocación: datos conectas a los datos.
y algoritmos tienen valor para el ne-
gocio solo en la medida en que pueden Pero ¿qué consideraciones hay que tener
dar respuestas diferenciales (es decir, en cuenta para la implantación exitosa
de alto valor añadido) a problemas de de un sistema de Machine Learning y Big
negocio. Como en el caso de “Pen- Data?”.
“Datos y algoritmos tienen samiento Profundo”, las respuestas
valor para el negocio solo en son útiles si las preguntas están bien 1. Verificar la calidad de los datos:
la medida en la cual pueden formuladas. como norma general, antes de usar
dar respuestas diferenciales (es cualquier tipo de información, hay que
decir, de alto valor añadido) a Un ejemplo esclarecedor: imaginemos verificar la calidad de los datos, así como
problemas de negocio. Las res- el caso de un fabricante de cerveza su consistencia y fiabilidad. Si las rele-
puestas son útiles si las pregun- que quiere descubrir si la información vaciones atmosféricas son imprecisas,

tas están bien formuladas” relativa al tiempo atmosférico puede los resultados de los algoritmos serán
ayudarle a mejorar su negocio. Decide falaces (“Garbage In – Garbage Out”).
comprar una plataforma de Big Data
para almacenar relevaciones de indi- 2. El Machine Learning no sabe juntar
cadores atmosféricos a nivel de hora y fuentes de información: para la aplica-
sección censal y, a la vez, información de ción, todo serán datos sin ninguna con-
consumo de unidades en punto de venta notación semántica. Aparecerán, por un

15
lado, los datos atmosféricos (coordena- b. Una vez entendido cómo todos estos
das geográficas, fechas y horas, números factores influencian el consumo de
decimales que representan mililitros cerveza, ¿cómo se pueden utilizar
de lluvia, etc.) y, por otro, los relativos para mejorar el negocio? ¿Anticipando
al producto (códigos, ventas, consumo, el consumo esperado y sugiriendo el
etc.). El Machine Learning podría llegar a pedido de reposición al Local, basán-
sugerir a través de qué campos relacio- dose en las predicciones del tiempo?
nar las diferentes fuentes de información, ¿Identificando patrones de consumo
pero, en general, le faltará contexto para conjunto de productos en función
desempatar entre dos o más opciones del tiempo atmosférico, de la franja
que son plausibles. horaria, del precio (real o percibido)
que permitan añadir al pedido de
3. Los algoritmos de Machine Learning reposición productos en promoción
clasifican o predicen variables que, por que tienen alta probabilidad de ser
sí mismas, no existen en la información comprados?
base, sino que tienen que ser creadas. Recomendaciones para directivos:
Como se puede observar, las preguntas
4. Estas variables irán en función del planteadas son concretas y, aun así, no • Por sí solos, los datos y algorit-
problema de negocio que se quiere re- llegan a reflejar todo lo que se podría ha- mos no representan un valor añadido
solver. En el caso de nuestro ejemplo, hay cer con semejante información. Al mismo al negocio. Únicamente lo tendrán
probablemente dos grupos de preguntas tiempo, también queda patente que, sin si son capaces de dar respuestas di-
clave: una buena pregunta (o más de una), la ferenciales a problemas de negocio.
“Máquina” no puede contestar, porque Y, para que estas respuestas cum-
a. ¿Hay algún tipo de relación entre le falta todo el contexto del negocio que plan con su objetivo, resulta impres-
el tiempo atmosférico y el consumo nosotros damos por sentado. cindible que las preguntas estén bien
de cerveza que planteábamos en formuladas.
el ejemplo del apartado anterior? 5. Por último, cabe plantearse las si-
¿Cuáles son las variables que más guientes preguntas para que el éxito sea • Para el éxito de una iniciativa de
influyen (intensidad de precipitaciones, total: sea cual sea el output generado por Machine Learning & Big Data, no
temperatura, intensidad del viento…)? la “Máquina”, ¿será el fabricante capaz solo es importante tener claros
¿Tienen siempre la misma relevancia de diseñar e implementar acciones que lo objetivos de negocio, sino también la
o ésta puede variar en función de las aprovechen? ¿Cuánto costará el cambio capacidad de llevar a cabo de forma
características del local, de la geogra- de modelo de trabajo comparado con los rentable las soluciones sugeridas.
fía, del perfil de cliente…? beneficios incrementales?

16
4. REQUISITOS PARA OBTENER VALOR DIFERENCIAL

Llegados a este punto, cabe preguntarse: ¿qué requisitos tienen que cumplirse para que el Machine Learning y el Big
Data aporten un valor realmente diferencial?

Antes de arrancar una iniciativa de Machine Learning & Big Data, es imprescindible detenerse a evaluar una serie de
requisitos que aseguren el éxito de la iniciativa:

Requisitos Descripción Siguiendo el ejemplo de la cervecera…

Disponibilidad de Accesibilidad: Los datos tienen que ser accesibles para Si la generación de recomendaciones de pedi-
los Datos garantizar fluidez en su procesamiento y generación del do de reposición está pensada para ser diaria
input para los procesos de negocio afectados. o incluso intra-diaria, el flujo de información
de tiempo atmosférico tiene que tener una
frecuencia al menos igual o superior.

Calidad: los datos tienen que ser fiables, es decir, repro- Dado que los datos de tiempo atmosféricos
ducir fielmente y de forma consistente en el tiempo lo son, normalmente, interpolados, hay un sesgo
que se pretende cuantificar. inherente al proceso analítico que los use. No
obstante, la interpolación puede ser suficien-
temente buena como para garantizar valores
coherentes y en línea con las variables de
negocio que se quieren explicar.

Información estructurada vs no estructurada: hay esen-


cialmente dos tipos de información:
• Estructurada, es decir, almacenada en un formato
estandarizado y fácilmente manipulable y accesible,
como las Bases de Datos tradicionales. Puede ser utiliza-
da de forma casi inmediata, donde el “casi” depende del
formato de almacenamiento.
• No estructurada: textos libres, información extraída
de redes sociales, imágenes, vídeos, etc. Tiene un po-
tencial enorme, pero requiere un esfuerzo inicial mucho
mayor, comparado con el caso de la información estruc-
turada, para poder ser utilizada eficazmente.

Es importante, por lo tanto, saber valorar y estimar el


valor añadido representado por cada tipo de información
en comparación con los costes que supone su utilización
de forma eficaz.

17
Requisitos Descripción Siguiendo el ejemplo de la cervecera…

Precio: según el problema que se quiera resolver, es po- En el caso de la cervecera, por ejemplo, infor-
sible adquirir información externa, la cual, obviamente, mación meteorológica.
suele tener un precio proporcional a su calidad o al nivel
de granularidad exigido.
Dado que los proveedores de datos ofrecen diferentes
planes de precios en función de las opciones de adquisi-
ción de la información, será siempre necesario analizar
qué tipo de información externa se precisa, con qué ca-
lidad y granularidad y qué precisión adicional se espera,
antes de realizar la inversión.

Los beneficios Las técnicas avanzadas de Machine Learning suelen


de una mayor proporcionar mejoras sustanciales con respecto a las
previsión en la técnicas analíticas más tradicionales cuando se puede
predicción supe- realmente trabajar en un entorno de Big Data o cuando
ran el esfuerzo de el problema de negocio es, por su propia naturaleza, im-
implementación posible de ser tratado eficazmente sin Machine Learning
(por ejemplo: reconocimiento de imágenes).
Hay muchos casos, típicamente cuando la información
es información transaccional estructurada – a menudo,
incompleta o no suficiente para explicar el problema de
negocio – donde la precisión incremental aportada por el
Machine Learning es residual si la comparamos con la
inversión necesaria para llevarla a cabo.
Un Data Scientist experto sabrá valorar en cada
momento cuándo vale la pena dar el salto al Machine
Learning.

18
Requisitos Descripción Siguiendo el ejemplo de la cervecera…

Resultados de los Aunque parezca obvio, el resultado de un modelo analíti- Los sensores instalados en los surtidores de
modelos integra- co debe poderse utilizar dentro de un proceso de negocio. los locales permitirían:
dos en los proce- Menos obvio es cómo será posible: • Proyectar el consumo de las siguientes
sos de negocio • ¿Cómo viajarán, de forma automática y recurrente, horas/días
los datos que alimentarán el modelo al sistema donde • Comparando con los niveles de stock,
reside el Motor Analítico? detectar alertas de ruptura
• ¿Cómo serán devueltos los resultados a los siste- • Calcular un pedido óptimo de reaprovisio-
mas origen o a los sistemas de soporte a la toma de namiento
decisiones? • Lanzar una notificación al responsable del
• ¿Qué reglas/acciones deberán ser implementadas local con la recomendación de pedido
en los sistemas para que el uso de los resultados del • Re-planificar la logística para poder entre-
Machine Learning sea fluido y requiera de la mínima gar a tiempo el pedido extra de reaprovisio-
intervención humana? namiento
Las condiciones para todo lo anterior son:
• Automatización de la transferencia de datos en
tiempo real, de los locales a la cervecera.
• Un Motor Analítico capaz de procesar rápidamente
y con alta frecuencia la previsión del consumo y recal-
cular los pedidos de reaprovisionamiento.
• Integración completa entre el Motor Analítico y los
sistemas de CRM, para lanzar las notificaciones a los
responsables de los locales.
• Integración completa con los sistemas de logística,
para adaptar el plan de entregas.
• Un sistema ágil de interacción con el local (por
ejemplo: una aplicación móvil) que permita enviar no-
tificación y recibir respuestas en tiempos muy cortos.
De no ser posibles los puntos anteriores, un modelo de
Machine Learning, por sofisticado que sea, no podría
proporcionar el salto de calidad esperado, debido a las
limitaciones del entorno y de los procesos existentes.
Por lo tanto, hay que tener en cuenta que una solución de
Machine Learning & Big Data puede implicar una trans-
formación completa hacia la digitalización, para poder
realmente aprovechar todo el potencial.

19
Para introducir Data Science en una
organización, es necesario incorporar
perfiles que dominen el análisis de datos
y los algoritmos de Machine Learning,
que cuenten con conocimiento tecnoló-
gico y con la visión de negocio necesaria
para diseñar e implementar una solución
de Machine Learning & Big Data. Asimis-
mo, un buen Data Scientist ha de contar
con años de experiencia (más allá de la
5. LOS NUEVOS PROFESIONALES propia formación).

Sin duda, perfiles escasos por la cre-


Uno de los errores más comunes a la ciente demanda de la que disfrutan en el
hora de emprender la implementación mercado. Si bien es cierto que la oferta
de una plataforma de Machine Learning ha crecido acorde a la demanda y que
& Big Data es creer que es una cuestión seguirá haciéndolo, tanto en número
de seleccionar la tecnología o el software de profesionales como en experiencia
adecuado; o el asumir que, una vez los aportada.
datos empiecen a fluir a la plataforma,
ésta sea capaz de aprender sola (“¿No Ante la complejidad de encontrar a profe-
era aprendizaje automático?”) y generar sionales que aglutinen todas estas capa-
“La Inteligencia Artificial más valor. cidades, más común es poder contar con
avanzada aún no es capaz de perfiles de Data Scientists que cubran
reemplazar al hombre” Desafortunadamente, no suele ser el las necesidades en cuanto a análisis de
caso porque, como ya hemos menciona- datos, algoritmos de Machine Learning y
do anteriormente: conocimiento tecnológico. También con
• Los problemas de negocio tienen perfiles de Negocio, pero con capacida-
que ser traducidos en problemas analíti- des y conocimientos destacables en el
cos. ámbito analítico, que actúen de punto de
• La información disponible tiene que unión entre Data Science y Negocio.
ser analizada e interpretada, y su nivel de
completitud es evaluado. Por tanto, se puede afirmar que no puede
• Lo algoritmos más avanzados tie- existir Machine Learning & Big Data sin
nen que ser entrenados y testados. una seria apuesta por este tipo de profe-
• La solución que se implemente sionales, tanto en plantilla como a través
necesitará mantenimiento, ya que la de servicios profesionales.
realidad del negocio es cambiante. Tanto
los algoritmos como la definición misma
del problema analítico tienen que ser
actualizados constantemente. Recomendaciones para directivos:

Hoy en día, la Inteligencia Artificial más • Para obtener el máximo


avanzada no es capaz de reemplazar al provecho, es necesario conjugar
hombre en las tareas anteriores. Es solo una buena solución de Inteligencia
con la conjunción de las capacidades de Artificial con un equipo de expertos
las máquinas y los conocimientos de las en Data Science, que además domine
personas cuando las compañías pueden el funcionamiento del negocio.
alcanzar todo su potencial.

20
6. CONCLUSIONES

El ser humano procesa un número muy Aun así, nos seguimos preguntando, ¿es el
limitado de variables para tomar una aprendizaje automático adecuado para mí?
decisión racional. Cuando nos enfrenta-
mos a un problema complejo que excede Desde esta perspectiva, la respuesta es,
nuestra capacidad de razonamiento, claramente, sí. Porque la transformación
las mejores decisiones son, a menudo, ya ha empezado y no se parará: para
“Machine Learning & Big Data inconscientes y se toman guiadas por la poder sobrevivir en un mercado cada vez
e Inteligencia Artificial ya no intuición. más competitivo, las claves serán conse-
son un Nice-to-Have sino un guir mayor eficiencia (en forma de auto-
Must-Have” Con el aprendizaje automático esta matización inteligente de los procesos) y
limitación desaparece: las decisiones mayor eficacia (en forma de decisiones

“La pregunta no es ya si es óptimas vuelven a ser las decisiones más acuñadas y de mayor impacto).
racionales.
necesario implementar una
El aprendizaje automático ya está aquí.
solución de Machine Learning
Los humanos tenemos toda la vida para Las máquinas seguirán su carrera impa-
& Big Data, sino cuándo”
aprender; las máquinas no tienen tanta rable de aprendizaje, la automatización
paciencia. Una de las disciplinas de reemplazará al ser humano en los tra-
aprendizaje automático es el aprendizaje bajos repetitivos, los vehículos circularán
reforzado, en el que las máquinas ad- con conducción autónoma, el diagnóstico
quieren conocimiento solas, simplemente médico se hará de forma remota, los equi-
captando información sobre las reglas pos y los objetos estarán interconectados
del entorno. -internet de las cosas- y será en torno a
2040. Aunque nos quede tiempo para vivir
Años de aprendizaje y conocimiento acu- esta realidad, es hoy cuando tenemos que
mulado del ser humano se transforman rotar hacia lo nuevo y convertir en realidad
en minutos para una máquina: pasa de nuestras decisiones inteligentes: operati-
saber únicamente cómo se mueven las vas, tácticas y estratégicas.
piezas en un tablero de ajedrez a conver-
tirse en un experto y vencer al campeón Machine Learning & Big Data e Inteligen-
del mundo en tan solo unas horas de cia Artificial ya no son un Nice-to-Have
práctica. sino un Must-Have.

21
Recomendaciones para directivos:
El no reunir los requisitos necesarios
debería leerse como una campana de • La transformación digital y la
alerta: ya representa una desventaja aplicación de nuevas tecnologías en
competitiva que cuestiona la superviven- lo ordinario ya está aquí. Tendrás
cia en el medio y largo plazo. que ponerte en marcha si no quieres
verte superado por un mercado muy
La pregunta no es ya si es necesario disruptivo donde la competitividad
implementar soluciones de Machine será cada vez más extrema. La digi-
Learning & Big Data, sino cuándo. Y, talización no es una opción.
cuanto antes, mejor.

22
7. GLOSARIO

• Algoritmos: conjunto de instruccio- fenómeno históricamente observado y


nes o reglas bien definidas, ordenadas y registrado. Por ejemplo, un modelo su-
que permiten llevar a cabo una actividad pervisado de detección de fraude intenta
mediante una serie de pasos sucesivos. A clasificar automáticamente los casos que
partir de un dato inicial, se llevan a cabo históricamente has sido considerados
esta serie de pasos para obtener un re- fraudulentos.
sultado final. En lo que se refiere a algo-
ritmos de aprendizaje automáticos, estos • Aprendizaje reforzado (o aprendizaje
reciben una entrada (los datos disponi- por refuerzo): estos algoritmos aprenden
bles y tratados), de manera que puedan interactuando con el mundo que los ro-
ser utilizados por el algoritmo. Se realiza dea, es decir, se retroalimentan del mun-
la ejecución de los pasos necesarios, ya do exterior. Su aprendizaje está basado
sea una clasificación, una previsión o una en recompensas que obtienen cuando
segmentación, y se produce una salida toman decisiones que permiten maximi-
que corresponde al objetivo buscado. zar el objetivo deseado. Un algoritmo que
juega al ajedrez tan solo conociendo las
• Algoritmos no supervisados: son reglas del juego es un ejemplo de ello. El
aquellos algoritmos que intentan prede- algoritmo aprenderá simulando partidas
cir un fenómeno que históricamente no en las que, en cada situación, tomará una
ha podido ser observado. Por ejemplo, un decisión posible, y recibirá una recom-
modelo no supervisado de detección de pensa cuando su decisión lo conduzca a
fraude intenta agrupar casos que, debido ganar la partida.
a sus características diferenciadas del
resto de casos, podrían considerarse sos- • Comportamiento automático: son
pechosos, pero no hay ninguna evidencia aquellas decisiones que los modelos y
histórica de que lo hayan sido. algoritmos de aprendizaje automático
pueden tomar sin necesidad de la inter-
• Algoritmos semi-supervisados: vención de los humanos.
combinación de algoritmos supervisados
y no supervisados. • Data Scientist: es la denominación
que reciben actualmente los profesiona-
• Algoritmos supervisados: son aque- les dedicados al análisis y manipulación
llos algoritmos que intentan predecir un de datos. Utilizan metodologías estadís-

23
ticas avanzadas y tienen la capacidad de analíticos y que nos permite tomar deci-
desarrollar algoritmos y modelos analíti- siones que impactan en el negocio.
cos utilizando herramientas estadísticas
de programación. • Paralelización: en el contexto de este
artículo, se refiere a la capacidad de eje-
• Datos estructurados y no estruc- cutar algoritmos de aprendizaje automá-
turados: los datos estructurados son tico utilizando varios CPU/ordenadores
aquellos que se encuentran organizados simultáneamente logrando, así, mucha
en un repositorio de datos con un formato rapidez en la ejecución.
específico; por ejemplo, códigos de iden-
tificación de clientes, importes o fechas. • Patrones: en el contexto de este
Cada uno se corresponde con una co- artículo, se refiere a perfiles de compor-
lumna en una base de datos. En cambio, tamiento.
los datos no estructurados no tienen una
estructura definida. Son, por ejemplo, los
ficheros de texto, datos de redes sociales,
fotos o vídeos, entre otros.

• Estadística paramétrica: son análisis


basados en distribuciones conocidas. Por
ejemplo, en el análisis de supervivencia
de ciertos productos, se asume que su
ciclo de vida sigue una distribución de
Weibull o distribución Exponencial que
estima qué probabilidad tiene un produc-
to de fallar en un momento determinado.

• Granularidad: se refiere al nivel


jerárquico o nivel de detalle de los datos.
Por ejemplo, en el caso de una prenda de
vestir, el análisis requerido podría ser a
nivel de categoría de producto o producto
/ talla /color.

• Información accionable: es el tipo Nube de palabras: representación de las palabras más destacadas
de información que generan los modelos en el presente informe.

24
8. BIBLIOGRAFÍA

• Russell, Stuart and Norvig, Peter


(2009, 3rd ed.). Artificial Intelligence: A
Modern Approach. Prentice Hall.

• Barrat, James (2013). Our Final In-


vention: Artificial Intelligence and the End
of the Human Era. Thomas Dunne Books.

• Sigman, Mariano (2015). La vida


secreta de la mente. Debate.

• Sutton, Richard S. & Barto, Andrew


G. (2015). Reinforcement Learning: An
Introduction. The MIT Press.

• Tegmark, Max (2017). Life 3.0: Being


Human in the Age of Artificial Intelligen-
ce. Knopf.

• Alphago (2017). IMDB: https://www.


imdb.com/title/tt6700846/.

25
9. SOBRE LOS AUTORES

Javier Kuperman Franz Naselli Jesús E. Gabaldón

Ingeniero en Sistemas por la Uni- Licenciado en Matemáticas por la Doctor en Ciencias Físicas por la
versidad Tecnológica Nacional de “Università degli Studi di Milano” y Universitat Politècnica de Catalunya y
Buenos Aires, Argentina. Post-Grado en “Matemàtiques pels licenciado (MSc) en Bioquímica por la
Instruments Financers” por la “Uni- Universidad de Barcelona.
Senior Manager en el grupo de versitat Autònoma de Barcelona”.
Inteligencia Aplicada de Accenture y Senior Manager en el grupo de
miembro del Centro de Innovación de Ha trabajado en Consultoría TIC Inteligencia Aplicada de Accenture,
Analytics. Más de 20 años de expe- (Soluziona TI, ahora Indra), Con- miembro del Centro de Innovación
riencia en el desarrollo y liderazgo sultoría de Estrategia de Marketing de Analytics y responsable del área
de soluciones basadas en analítica y Ventas (Daemon Quest, ahora de Mantenimiento Predictivo para el
avanzada, inteligencia artificial y Deloitte) y, actualmente, es Senior mercado europeo.
aprendizaje automático, principal- Manager en el grupo de Inteligencia
mente en áreas vinculadas con la Aplicada de Accenture y miembro del Después de 12 años en investigación
cadena de suministro y operaciones. Centro de Innovación de Analytics, fundamental en simulación numéri-
donde es responsable del área de ca, sistemas dinámicos y dinámica de
“Forecasting”. fluidos en España, Alemania y Fran-
cia, a su vuelta a España emprende
Lleva más de 13 años trabajando en su carrera profesional en el ámbito
la creación de soluciones analíticas privado en ingeniería de software y
avanzadas, inteligencia artificial y analítica, acumulando un total de
aprendizaje automático, tanto en las más de 20 años de experiencia en
áreas de Marketing & Ventas (CRM, análisis operacional, modelos mate-
Optimización de Redes de Ventas…) máticos y arquitectura de sistemas.
como en Cadena de Suministro (Pre-
dicción y Planificación de la Demanda
y Optimización de Inventario).

26
28

También podría gustarte