Machine Learning
Machine Learning
ÍNDICE
CAPÍTULO PÁGINA
01_ Presentación 4
02_
01— Estadística, Data Mining, Analytics
y Machine Learning: un poco de historia 5
03_
01.1— ¿En qué consiste el Machine Learning? 6
07_
03— ¿Cómo asegurar que la inversión en Machine
Learning y Big Data sea altamente rentable? 14
08_
04 Requisitos para obtener valor diferencial 17
09_—
05— Los nuevos profesionales 20
10_ Conclusiones
06— 21
07— Glosario
11_ 23
08— Bibliografía
12_ 25
3
PRESENTACIÓN
La irrupción de nuevas tecnologías aplica- Seguidamente, los autores explican me-
das al análisis de datos puede arrastrar a diante experiencias reales las fórmulas
las empresas a una sensación de vértigo. más acertadas para que la organización
No hay motivo real para que ello ocurra. haga un uso eficiente de la tecnología Big
Las empresas vienen usando información Data y el Machine Learning. También se
para optimizar sus resultados desde mu- advierte que la acumulación masiva de
chas décadas atrás, si bien es cierto que datos no proporciona, por sí misma, nin-
los procesos están ganando en compleji- gún beneficio para la empresa: el directivo
dad: es posible recoger muchos más datos debe decidir qué datos interesan realmen-
y más variados en un espacio de tiempo te y descartar aquellos que no aportan
sensiblemente menor. Esta dinámica obli- valor. Con esta finalidad, el presente
gará a los directivos a tomar decisiones en informe recopila también algunas reco-
tiempo real y predecir un nuevo escenario mendaciones para llevar a cabo una apli-
al que ningún profesional podrá permane- cación eficiente del sistema Big Data y del
cer ajeno. Machine Learning, así como los requisitos
que se precisan para que la implantación
Nuestro propósito es que este informe sea de ambas tecnologías sea exitosa y aporte
un instrumento útil para los directivos a la valor añadido al negocio.
hora de enfrentarse a los retos que plan-
tea la Inteligencia Artificial y que puedan Los perfiles -técnicos y directivos- que se
obtener el máximo valor para el negocio a necesitan para desarrollar una solución de
partir de las herramientas que esta nueva Machine Learning constituyen, igualmente,
tecnología nos proporciona. También pre- un aspecto fundamental para garantizar el
tende indicar, a través de una serie de re- éxito del sistema. El documento recoge las
comendaciones y consejos, cómo hacer un skills más importantes que deben tener
uso eficiente de las mismas, consiguiendo ambos perfiles para un buen uso de esta
un rendimiento óptimo desde el punto de tecnología.
vista de la gestión del negocio.
El cierre del informe “Machine Learning,
El primer capítulo de este documento hace Inteligencia Artificial y Big Data. Lo que
un repaso a cómo las empresas, histó- todo directivo debe saber” lo protagonizan
ricamente y en los años recientes, han las conclusiones que pueden extraerse del
utilizado información y datos para mejorar documento, evidenciando que la aplicación
sus objetivos comerciales. Asimismo, hace de una solución de Big Data y Machine
referencia a la evolución de la aplicación Learning es completamente necesaria
de estos datos: cómo pasaron de ser para el negocio.
meros registros, a utilizarse para mejorar Xavier Gangonells
el negocio. Director general de AED
4
Como expertos en minería de datos y aprendizaje
automático, hemos tenido que explicar a profesio-
nales de otras disciplinas, en numerosas situa-
ciones, en qué consisten estos conceptos y cómo
podrían incorporarlos en sus compañías. Con este
artículo esperamos haberlo logrado: conectar con
el negocio y hablar su mismo idioma es nuestra
especialidad.
Al principio eran datos y, después, su transaccional. Ya no se trata solo de los Después, en el menor tiempo posible,
análisis e interpretación. Un ordenador reportes de las ventas del último mes querrá medir el impacto y la respuesta de
de mesa, herramientas estadísticas, por tienda y SKU (código de artículo), los consumidores.
reportes básicos y un grupo de expertos sino que es indispensable conocer las
era suficiente para tomar decisiones ventas de ayer por SKU, tienda y cliente. La conjunción tiempo, información y ex-
operativas. Los directores de Marketing y Y no solo eso: quién es mi cliente, con pectativas de los clientes exige un enfo-
planificadores de la demanda, para anti- qué frecuencia compra, qué anuncios le que más allá de un grupo de expertos que
cipar el volumen de ventas del siguiente agradan, dónde vive y cuántos hijos tiene. toman decisiones en base a su experien-
trimestre o el impacto que tendría una Y aún más: qué tiempo hacía cuando cia e intuición. Ya no alcanza la potencia
nueva promoción, únicamente se valían realizó la compra y cómo circulaba el de un ordenador de mesa y ni siquiera la
de informes mensuales que confirmasen tráfico por las carreteras. Y también: de un servidor para procesar los grandes
su intuición. a qué precio vendían los competidores volúmenes de información. Ya no solo
un producto similar y qué promociones gestionamos datos estructurados como
Así, el uso de los datos se circunscribía estaban disponibles. nombres, volúmenes de venta y fechas;
únicamente al ámbito en el que eran la información se captura en comentarios
creados: las ventas históricas explicaban En definitiva, los datos dejan de ser un de texto por parte de clientes o perfiles
las futuras, el tiempo previsto determi- puro registro y reflejo de las activida- técnicos, mediante mensajes grabados,
naba si era conveniente abrigarse o salir des de negocio para interrelacionarse imágenes y vídeos que es indispensable
con paraguas y las reclamaciones de e interconectarse; mientras, el tiempo interpretar. En dos palabras: Big Data.
garantías se utilizaban para reembolsar adquiere una nueva dimensión: prima
a los agentes responsables de la repara- la inmediatez en la toma de decisiones. La definición de Big Data no puede
ción de productos. El director de Ventas ya no solicita un limitarse a su simple traducción literal
informe mensual. Quiere saber qué pro- como “grandes datos”. Tiene un alcance
Con el tiempo, los datos capturados se moción lanzar y sobre qué producto, qué superior y podríamos sintetizarlo en las 3
multiplican y el fin deja de ser puramente estrategia usar y durante cuánto tiempo. V que los definen.
5
“Los datos dejan de ser un puro
registro y reflejo de las activi-
dades de negocio para interre-
lacionarse e interconectarse;
mientras, el tiempo adquiere
una nueva dimensión: prima la
inmediatez en la toma de deci-
siones”
6
Los modelos
mejorar sus resultados un 20% a la vez matemáticos
que se incrementó la actividad de los
clientes en redes sociales con relación a De la misma manera que los expertos
estas prendas. aprenden de manera intuitiva y toman la
decisión que consideran más adecuada,
los modelos matemáticos son capaces
Caso 2: Planta de fabricación de maqui- de proveer información útil. La simu-
naria agrícola lación de toma de decisiones con datos
El ingeniero de una planta de fabricación históricos nos dará el nivel de confianza
“El comportamiento automático de maquinaria agrícola reconoce que los esperado; de modo que la intuición de los
consiste en utilizar la infor- nuevos componentes incorporados en expertos se transforma en datos cuanti-
mación histórica almacenada el último modelo de uno de sus produc- ficados.
7
1.2 ¿Por qué funcionan los algoritmos de Machine Learning?
En cualquier proceso analítico, el objetivo En definitiva, los algoritmos de Machine bastante relativa-, sino de su correcta
principal es extraer información Learning resultan en gran medida efica- estratificación. Y, muy especialmente, de
accionable del conjunto de datos. Es ces para abordar problemas de segmen- la correcta identificación de las fuentes
decir, información objetiva y operacio- tación, clasificación e incluso predicción. de variación, así como de los respectivos
nalmente válida, ya sea para la toma de Un ejemplo de ello, en una de las áreas factores de ponderación.
decisiones o para el control de procesos en las que, probablemente, vamos a ser
en tiempo real. testigos de grandes avances, es en la En este sentido, los algoritmos de
comunicación: tales como los sistemas Machine Learning son capaces de extraer
La característica fundamental de los de recomendación que muchos de noso- patrones de variación de manera mucho
algoritmos de Machine Learning es su tros utilizamos habitualmente en tiendas más eficiente que los considerados
extraordinaria capacidad para extraer online, apps de agregación de noticias u “métodos clásicos”, basados en la
patrones que se escapan a la mayoría otras aplicaciones. estadística paramétrica. Los algoritmos
de métodos aplicados históricamente. no asumen ningún tipo de prerrequisito
Además, destaca su versatilidad para Por otro lado, Machine Learning puede previo, ya sea normalidad o potencia de la
trabajar con información gráfica, soni- contrarrestar de manera eficiente uno de muestra.
dos o lenguaje natural, entre otros, y de los principales problemas no resueltos
generar resultados de la misma natura- en Big Data: el sesgo. Como bien saben En sectores maduros en los que la ope-
leza. Son altamente eficientes los analistas encargados de realizar rativa empresarial o industrial depende
con series de datos complejas y con encuestas electorales, su acierto no solo directamente o está estrechamente
múltiples escalas o factores de varia- depende del tamaño de la muestra -de vinculada con el resultado de algún tipo
ción. hecho, este suele tener una importancia de modelo predictivo, una mejora signifi-
8
cativa en dicho resultado en términos de
alcance o precisión representa igualmen- Recomendaciones para directivos:
te un impacto económico que hay que
valorar. En muchos casos, la aplicación • La adopción del Machine Lear-
de modelos de Machine Learning consti- ning en ningún caso implica romper
tuye una ventaja competitiva relevante a con el pasado y empezar de cero,
considerar. sino que combina toda la experiencia
y el conocimiento previo del negocio
Sin embargo, a pesar del inmenso aba- con los nuevos datos recogidos para
nico de aplicaciones que ofrece esta tec- que, una vez tratados con los proce-
nología y del avance que supone con res- dimientos adecuados, aporten nueva
pecto al pasado más reciente, estamos información más completa y útil.
todavía lejos de poder confiar ciegamente
en ella. Para crear y alimentar las varia-
bles que formarán parte de los algorit-
“La característica fundamental mos y poder ponderarlas adecuadamente
9
2. MACHINE LEARNING & BIG DATA:
MÁS ALLÁ DE LA MODA
¿Por dónde empezar? Estudiar casos semejante con MCT (Microsoft Cognitive
de empresas que ya han recorrido un Toolkit, conocido anteriormente como
primer trecho del camino puede ayudar a CNTK); Amazon difundió los últimos
orientar la aplicación de esta tecnología avances en MXNet1 y Facebook presentó
en una empresa. Por suerte, varios gi- no uno sino dos proyectos: Torch y Caffe.
gantes tecnológicos han compartido sus Por otro lado, la propia comunidad OS,
primeras experiencias y conclusiones con bajo el paraguas de la Apache Software
el resto de la comunidad. Foundation, da cobertura a un gran nú-
mero de iniciativas independientes, tanto
Si bien es cierto que la evolución del a nivel de tecnologías Big Data como en
conocimiento y el desarrollo tecnológico Inteligencia Artificial.
no suelen seguir procesos lineales, sino
que alternan periodos de efervescencia El hecho de liberar el código, aunque sea
y rápido desarrollo con otros de imple- bajo diferentes tipos de licencia, no hace
mentación y despliegue tecnológico, más que favorecer y alimentar a escala
estos años bien podrían considerarse global la investigación por parte de los
los del Aprendizaje Automático (Machine diferentes grupos de desarrolladores
Learning). Años en los que esta disciplina alrededor del mundo, ya pertenezcan
se incorporó en los planes de desarrollo a grandes corporaciones o se trate de
tecnológico de muchas compañías. genios solitarios.
En los últimos tiempos, hemos conoci- Tampoco resulta excepcional que algunos
do (y seguiremos conociendo) un gran desarrolladores afiliados a grandes
número de noticias relacionadas con la empresas tecnológicas den rienda suelta
Inteligencia Artificial y, en concreto con a su creatividad en su tiempo libre,
el Machine Learning. Distintas empresas liderando o, cuanto menos, aportando su
líderes han aprovechado para liberar granito de arena a algunos de estos pro-
1. Vogels, W. (2016). MXNet - Deep en la comunidad Open Source (OS) sus yectos. Sea el caso que sea, la mayoría
Learning Framework of Choice at AWS. respectivos avances en este área. de licencias OS obligan a los desarrolla-
2018, de All Things Distributed Sitio dores a difundir, asimismo, sus avances y
web: https://www.allthingsdistributed. Sin ir más lejos, Google presentó Ten- modificaciones, por lo que la masa crítica
com/2016/11/mxnet- default-framework- sorFlow; Microsoft, siempre amante aumenta exponencialmente acelerando
deep-learning-aws.html de los cambios de nombre, realizó algo todavía más el proceso.
10
Learning requieren grandes volúmenes
de datos para entrenar y calibrar los
algoritmos, volúmenes mayores en varios
órdenes de magnitud que los requeridos
¿Por qué ahora? Machine Learning tienen su origen varias para satisfacer los criterios estadísticos y
décadas atrás (algunos, incluso, en los niveles de confianza habituales.
Una de las preguntas que surgen ante años sesenta del siglo pasado)?
este aluvión de noticias relacionadas Por otro lado, las herramientas y tecno-
con Machine Learning es: ¿por qué A diferencia de los métodos clásicos logías necesarias para manejar actual-
su desarrollo y aplicación despuntan basados en la estadística multi-paramé- mente los ingentes volúmenes de datos y
precisamente ahora, a pesar de que los trica, aquella en la que los datos reales la mayoría de los algoritmos de Machine
fundamentos teóricos de la mayoría de responden a distribuciones conocidas, Learning son computacionalmente tan
los algoritmos de Inteligencia Artificial y la mayoría de algoritmos de Machine exigentes, tanto, que requieren de uni-
A través de los siguientes gráficos (bajo estas líneas y en la página siguiente) se muestra la relevancia del interés de estos temas
objeto del informe, medidos a través de las búsquedas o menciones en diferentes redes sociales
Selected Topic 1 Previous Topic Next Topic Clear Topic Slide to adjust relevance metric:2 =
A=1 0.0 0.2 0.4 0.6 0.8 1.0
Intertopic Distance Map (via multidimensional scalingh) Top-30 Most Relevant Terms for Topic 1 (26.8% of tokens)
0 100 200 300 400 500
PC2
drone
robot
use
3 these
5 mind
2 1 machinelearnin
student
autonom
control
trend
deepleam
algorithm
data
insurtech
PC1 releas
rute
latest
top
human
bigdat
way
editor
bigdata
guest
drive
4
ht
will
big
health
Marginal topic distribution finserv
11
dades de procesamiento especializadas Por tanto, los factores desencadenantes En los últimos años se han registra-
con altísimos niveles de paralelización del rápido ascenso de las técnicas de do grandes avances; pero, como cabía
(GPUs). Machine Learning son fundamental- esperar, no todo han sido éxitos. Algunos
mente dos. Por un lado, el desarrollo de los fracasos más sonados tienen su
Así, las GPUs hace tiempo que dejaron de tecnológico y el acceso a grandes origen en un exceso de confianza y, por
ser exclusivas de las consolas de video- recursos computacionales a un coste ende, de falta de supervisión en la aplica-
juegos, de donde provienen, para formar asumible, no solo por parte de grandes ción automática de algoritmos.
parte no tan solo de las grandes infraes- empresas. En segundo lugar, la disponi-
tructuras de cálculo y servicios cloud, bilidad de grandes volúmenes de datos, Sin duda, el desarrollo y aplicación de las
sino también de la mayoría de tarjetas necesarios para entrenar adecuada- técnicas de Inteligencia Artificial seguirán
gráficas de altas prestaciones. mente los algoritmos. imparables durante los próximos años.
Selected Topic 4 Previous Topic Next Topic Clear Topic Slide to adjust relevance metric:2 =
A=1 0.0 0.2 0.4 0.6 0.8 1.0
Intertopic Distance Map (via multidimensional scalingh) Top-30 Most Relevant Terms for Topic 1 (14.6% of tokens)
0 50 100 150 200
PC2
tech
next
where
3 fintech
5 whi
2 1 bigdata
blockchain
innovat
announc
healthtech
ar
machineleam
ai
time
PC1 just
miagent
version
now
import
learn
thrill
toolkit
quartz
project
amp
4
guid
requir
drown
abou
Marginal topic distribution develop
12
“Los factores desencadenan-
tes del rápido ascenso de las
técnicas de Machine Learning
son fundamentalmente dos:
el desarrollo tecnológico y el Principalmente, en áreas más especia-
13
3. ¿CÓMO ASEGURAR QUE LA INVERSIÓN EN MACHINE
LEARNING Y BIG DATA SEA ALTAMENTE RENTABLE?
14
Es un error común pensar que contar con (asumamos, por un momento, que el fa-
muchos datos y una o más herramientas bricante tiene acceso a datos detallados
que implementan algoritmos de Machine de tickets y al consumo de cerveza de
Learning aportan, por sí mismos, valor al presión a través de sensores). Además,
negocio. se hace con las mejores aplicaciones de
Machine Learning y, simplemente, las
Pero no hay mayor equivocación: datos conectas a los datos.
y algoritmos tienen valor para el ne-
gocio solo en la medida en que pueden Pero ¿qué consideraciones hay que tener
dar respuestas diferenciales (es decir, en cuenta para la implantación exitosa
de alto valor añadido) a problemas de de un sistema de Machine Learning y Big
negocio. Como en el caso de “Pen- Data?”.
“Datos y algoritmos tienen samiento Profundo”, las respuestas
valor para el negocio solo en son útiles si las preguntas están bien 1. Verificar la calidad de los datos:
la medida en la cual pueden formuladas. como norma general, antes de usar
dar respuestas diferenciales (es cualquier tipo de información, hay que
decir, de alto valor añadido) a Un ejemplo esclarecedor: imaginemos verificar la calidad de los datos, así como
problemas de negocio. Las res- el caso de un fabricante de cerveza su consistencia y fiabilidad. Si las rele-
puestas son útiles si las pregun- que quiere descubrir si la información vaciones atmosféricas son imprecisas,
tas están bien formuladas” relativa al tiempo atmosférico puede los resultados de los algoritmos serán
ayudarle a mejorar su negocio. Decide falaces (“Garbage In – Garbage Out”).
comprar una plataforma de Big Data
para almacenar relevaciones de indi- 2. El Machine Learning no sabe juntar
cadores atmosféricos a nivel de hora y fuentes de información: para la aplica-
sección censal y, a la vez, información de ción, todo serán datos sin ninguna con-
consumo de unidades en punto de venta notación semántica. Aparecerán, por un
15
lado, los datos atmosféricos (coordena- b. Una vez entendido cómo todos estos
das geográficas, fechas y horas, números factores influencian el consumo de
decimales que representan mililitros cerveza, ¿cómo se pueden utilizar
de lluvia, etc.) y, por otro, los relativos para mejorar el negocio? ¿Anticipando
al producto (códigos, ventas, consumo, el consumo esperado y sugiriendo el
etc.). El Machine Learning podría llegar a pedido de reposición al Local, basán-
sugerir a través de qué campos relacio- dose en las predicciones del tiempo?
nar las diferentes fuentes de información, ¿Identificando patrones de consumo
pero, en general, le faltará contexto para conjunto de productos en función
desempatar entre dos o más opciones del tiempo atmosférico, de la franja
que son plausibles. horaria, del precio (real o percibido)
que permitan añadir al pedido de
3. Los algoritmos de Machine Learning reposición productos en promoción
clasifican o predicen variables que, por que tienen alta probabilidad de ser
sí mismas, no existen en la información comprados?
base, sino que tienen que ser creadas. Recomendaciones para directivos:
Como se puede observar, las preguntas
4. Estas variables irán en función del planteadas son concretas y, aun así, no • Por sí solos, los datos y algorit-
problema de negocio que se quiere re- llegan a reflejar todo lo que se podría ha- mos no representan un valor añadido
solver. En el caso de nuestro ejemplo, hay cer con semejante información. Al mismo al negocio. Únicamente lo tendrán
probablemente dos grupos de preguntas tiempo, también queda patente que, sin si son capaces de dar respuestas di-
clave: una buena pregunta (o más de una), la ferenciales a problemas de negocio.
“Máquina” no puede contestar, porque Y, para que estas respuestas cum-
a. ¿Hay algún tipo de relación entre le falta todo el contexto del negocio que plan con su objetivo, resulta impres-
el tiempo atmosférico y el consumo nosotros damos por sentado. cindible que las preguntas estén bien
de cerveza que planteábamos en formuladas.
el ejemplo del apartado anterior? 5. Por último, cabe plantearse las si-
¿Cuáles son las variables que más guientes preguntas para que el éxito sea • Para el éxito de una iniciativa de
influyen (intensidad de precipitaciones, total: sea cual sea el output generado por Machine Learning & Big Data, no
temperatura, intensidad del viento…)? la “Máquina”, ¿será el fabricante capaz solo es importante tener claros
¿Tienen siempre la misma relevancia de diseñar e implementar acciones que lo objetivos de negocio, sino también la
o ésta puede variar en función de las aprovechen? ¿Cuánto costará el cambio capacidad de llevar a cabo de forma
características del local, de la geogra- de modelo de trabajo comparado con los rentable las soluciones sugeridas.
fía, del perfil de cliente…? beneficios incrementales?
16
4. REQUISITOS PARA OBTENER VALOR DIFERENCIAL
Llegados a este punto, cabe preguntarse: ¿qué requisitos tienen que cumplirse para que el Machine Learning y el Big
Data aporten un valor realmente diferencial?
Antes de arrancar una iniciativa de Machine Learning & Big Data, es imprescindible detenerse a evaluar una serie de
requisitos que aseguren el éxito de la iniciativa:
Disponibilidad de Accesibilidad: Los datos tienen que ser accesibles para Si la generación de recomendaciones de pedi-
los Datos garantizar fluidez en su procesamiento y generación del do de reposición está pensada para ser diaria
input para los procesos de negocio afectados. o incluso intra-diaria, el flujo de información
de tiempo atmosférico tiene que tener una
frecuencia al menos igual o superior.
Calidad: los datos tienen que ser fiables, es decir, repro- Dado que los datos de tiempo atmosféricos
ducir fielmente y de forma consistente en el tiempo lo son, normalmente, interpolados, hay un sesgo
que se pretende cuantificar. inherente al proceso analítico que los use. No
obstante, la interpolación puede ser suficien-
temente buena como para garantizar valores
coherentes y en línea con las variables de
negocio que se quieren explicar.
17
Requisitos Descripción Siguiendo el ejemplo de la cervecera…
Precio: según el problema que se quiera resolver, es po- En el caso de la cervecera, por ejemplo, infor-
sible adquirir información externa, la cual, obviamente, mación meteorológica.
suele tener un precio proporcional a su calidad o al nivel
de granularidad exigido.
Dado que los proveedores de datos ofrecen diferentes
planes de precios en función de las opciones de adquisi-
ción de la información, será siempre necesario analizar
qué tipo de información externa se precisa, con qué ca-
lidad y granularidad y qué precisión adicional se espera,
antes de realizar la inversión.
18
Requisitos Descripción Siguiendo el ejemplo de la cervecera…
Resultados de los Aunque parezca obvio, el resultado de un modelo analíti- Los sensores instalados en los surtidores de
modelos integra- co debe poderse utilizar dentro de un proceso de negocio. los locales permitirían:
dos en los proce- Menos obvio es cómo será posible: • Proyectar el consumo de las siguientes
sos de negocio • ¿Cómo viajarán, de forma automática y recurrente, horas/días
los datos que alimentarán el modelo al sistema donde • Comparando con los niveles de stock,
reside el Motor Analítico? detectar alertas de ruptura
• ¿Cómo serán devueltos los resultados a los siste- • Calcular un pedido óptimo de reaprovisio-
mas origen o a los sistemas de soporte a la toma de namiento
decisiones? • Lanzar una notificación al responsable del
• ¿Qué reglas/acciones deberán ser implementadas local con la recomendación de pedido
en los sistemas para que el uso de los resultados del • Re-planificar la logística para poder entre-
Machine Learning sea fluido y requiera de la mínima gar a tiempo el pedido extra de reaprovisio-
intervención humana? namiento
Las condiciones para todo lo anterior son:
• Automatización de la transferencia de datos en
tiempo real, de los locales a la cervecera.
• Un Motor Analítico capaz de procesar rápidamente
y con alta frecuencia la previsión del consumo y recal-
cular los pedidos de reaprovisionamiento.
• Integración completa entre el Motor Analítico y los
sistemas de CRM, para lanzar las notificaciones a los
responsables de los locales.
• Integración completa con los sistemas de logística,
para adaptar el plan de entregas.
• Un sistema ágil de interacción con el local (por
ejemplo: una aplicación móvil) que permita enviar no-
tificación y recibir respuestas en tiempos muy cortos.
De no ser posibles los puntos anteriores, un modelo de
Machine Learning, por sofisticado que sea, no podría
proporcionar el salto de calidad esperado, debido a las
limitaciones del entorno y de los procesos existentes.
Por lo tanto, hay que tener en cuenta que una solución de
Machine Learning & Big Data puede implicar una trans-
formación completa hacia la digitalización, para poder
realmente aprovechar todo el potencial.
19
Para introducir Data Science en una
organización, es necesario incorporar
perfiles que dominen el análisis de datos
y los algoritmos de Machine Learning,
que cuenten con conocimiento tecnoló-
gico y con la visión de negocio necesaria
para diseñar e implementar una solución
de Machine Learning & Big Data. Asimis-
mo, un buen Data Scientist ha de contar
con años de experiencia (más allá de la
5. LOS NUEVOS PROFESIONALES propia formación).
20
6. CONCLUSIONES
El ser humano procesa un número muy Aun así, nos seguimos preguntando, ¿es el
limitado de variables para tomar una aprendizaje automático adecuado para mí?
decisión racional. Cuando nos enfrenta-
mos a un problema complejo que excede Desde esta perspectiva, la respuesta es,
nuestra capacidad de razonamiento, claramente, sí. Porque la transformación
las mejores decisiones son, a menudo, ya ha empezado y no se parará: para
“Machine Learning & Big Data inconscientes y se toman guiadas por la poder sobrevivir en un mercado cada vez
e Inteligencia Artificial ya no intuición. más competitivo, las claves serán conse-
son un Nice-to-Have sino un guir mayor eficiencia (en forma de auto-
Must-Have” Con el aprendizaje automático esta matización inteligente de los procesos) y
limitación desaparece: las decisiones mayor eficacia (en forma de decisiones
“La pregunta no es ya si es óptimas vuelven a ser las decisiones más acuñadas y de mayor impacto).
racionales.
necesario implementar una
El aprendizaje automático ya está aquí.
solución de Machine Learning
Los humanos tenemos toda la vida para Las máquinas seguirán su carrera impa-
& Big Data, sino cuándo”
aprender; las máquinas no tienen tanta rable de aprendizaje, la automatización
paciencia. Una de las disciplinas de reemplazará al ser humano en los tra-
aprendizaje automático es el aprendizaje bajos repetitivos, los vehículos circularán
reforzado, en el que las máquinas ad- con conducción autónoma, el diagnóstico
quieren conocimiento solas, simplemente médico se hará de forma remota, los equi-
captando información sobre las reglas pos y los objetos estarán interconectados
del entorno. -internet de las cosas- y será en torno a
2040. Aunque nos quede tiempo para vivir
Años de aprendizaje y conocimiento acu- esta realidad, es hoy cuando tenemos que
mulado del ser humano se transforman rotar hacia lo nuevo y convertir en realidad
en minutos para una máquina: pasa de nuestras decisiones inteligentes: operati-
saber únicamente cómo se mueven las vas, tácticas y estratégicas.
piezas en un tablero de ajedrez a conver-
tirse en un experto y vencer al campeón Machine Learning & Big Data e Inteligen-
del mundo en tan solo unas horas de cia Artificial ya no son un Nice-to-Have
práctica. sino un Must-Have.
21
Recomendaciones para directivos:
El no reunir los requisitos necesarios
debería leerse como una campana de • La transformación digital y la
alerta: ya representa una desventaja aplicación de nuevas tecnologías en
competitiva que cuestiona la superviven- lo ordinario ya está aquí. Tendrás
cia en el medio y largo plazo. que ponerte en marcha si no quieres
verte superado por un mercado muy
La pregunta no es ya si es necesario disruptivo donde la competitividad
implementar soluciones de Machine será cada vez más extrema. La digi-
Learning & Big Data, sino cuándo. Y, talización no es una opción.
cuanto antes, mejor.
22
7. GLOSARIO
23
ticas avanzadas y tienen la capacidad de analíticos y que nos permite tomar deci-
desarrollar algoritmos y modelos analíti- siones que impactan en el negocio.
cos utilizando herramientas estadísticas
de programación. • Paralelización: en el contexto de este
artículo, se refiere a la capacidad de eje-
• Datos estructurados y no estruc- cutar algoritmos de aprendizaje automá-
turados: los datos estructurados son tico utilizando varios CPU/ordenadores
aquellos que se encuentran organizados simultáneamente logrando, así, mucha
en un repositorio de datos con un formato rapidez en la ejecución.
específico; por ejemplo, códigos de iden-
tificación de clientes, importes o fechas. • Patrones: en el contexto de este
Cada uno se corresponde con una co- artículo, se refiere a perfiles de compor-
lumna en una base de datos. En cambio, tamiento.
los datos no estructurados no tienen una
estructura definida. Son, por ejemplo, los
ficheros de texto, datos de redes sociales,
fotos o vídeos, entre otros.
• Información accionable: es el tipo Nube de palabras: representación de las palabras más destacadas
de información que generan los modelos en el presente informe.
24
8. BIBLIOGRAFÍA
25
9. SOBRE LOS AUTORES
Ingeniero en Sistemas por la Uni- Licenciado en Matemáticas por la Doctor en Ciencias Físicas por la
versidad Tecnológica Nacional de “Università degli Studi di Milano” y Universitat Politècnica de Catalunya y
Buenos Aires, Argentina. Post-Grado en “Matemàtiques pels licenciado (MSc) en Bioquímica por la
Instruments Financers” por la “Uni- Universidad de Barcelona.
Senior Manager en el grupo de versitat Autònoma de Barcelona”.
Inteligencia Aplicada de Accenture y Senior Manager en el grupo de
miembro del Centro de Innovación de Ha trabajado en Consultoría TIC Inteligencia Aplicada de Accenture,
Analytics. Más de 20 años de expe- (Soluziona TI, ahora Indra), Con- miembro del Centro de Innovación
riencia en el desarrollo y liderazgo sultoría de Estrategia de Marketing de Analytics y responsable del área
de soluciones basadas en analítica y Ventas (Daemon Quest, ahora de Mantenimiento Predictivo para el
avanzada, inteligencia artificial y Deloitte) y, actualmente, es Senior mercado europeo.
aprendizaje automático, principal- Manager en el grupo de Inteligencia
mente en áreas vinculadas con la Aplicada de Accenture y miembro del Después de 12 años en investigación
cadena de suministro y operaciones. Centro de Innovación de Analytics, fundamental en simulación numéri-
donde es responsable del área de ca, sistemas dinámicos y dinámica de
“Forecasting”. fluidos en España, Alemania y Fran-
cia, a su vuelta a España emprende
Lleva más de 13 años trabajando en su carrera profesional en el ámbito
la creación de soluciones analíticas privado en ingeniería de software y
avanzadas, inteligencia artificial y analítica, acumulando un total de
aprendizaje automático, tanto en las más de 20 años de experiencia en
áreas de Marketing & Ventas (CRM, análisis operacional, modelos mate-
Optimización de Redes de Ventas…) máticos y arquitectura de sistemas.
como en Cadena de Suministro (Pre-
dicción y Planificación de la Demanda
y Optimización de Inventario).
26
28