Hacete Amigo de La Big Data - Esteban Magnani
Hacete Amigo de La Big Data - Esteban Magnani
Hacete Amigo de La Big Data - Esteban Magnani
Los gures del Big Data dicen que si se cruzan datos suficientes todo sera predecib
le. El poder de los datos masivos combinados con inteligencia artificial ya ha d
emostrado que puede prever el comportamiento humano y modificarlo. Google puede
vaticinar el prximo xito cinematogrfico: saben que trece bsquedas relacionadas con u
na nueva pelcula se traducen en una entrada vendida. Sensores en medios de transp
orte "adivinaran" qu pieza ser la prxima en romperse. Hay un lmite para asignar tareas
a los algoritmos? La educacin? La gestin democrtica? El periodista especializado Est
eban Magnani advierte los peligros y recomienda amigarse con las estadsticas.
En la famosa serie de ciencia ficcin conocida como Fundacin , el cientfico, escritor,
qumico, divulgador (y ms) Isaac Asimov apoya la trama sobre la psicohistoria, una
ciencia ficcional capaz de predecir el futuro de la sociedad aunque no los compo
rtamientos individuales. La idea se inspira de las frmulas que permiten conocer v
erdades estadsticas como el comportamiento de una masa concreta de gas pese a la
imposibilidad de prever el comportamiento de cada molcula. Lo que se obtiene es u
na suerte de verdad estadstica comprobable.
Para que funcione, la psicohistoria requiere dos condiciones: que se aplique sob
re gigantescas cantidades de seres humanos y que esos humanos desconozcan sus co
nclusiones. Quienes vean el futuro tendrn la irreparable tentacin de modificarlo:
de hecho, eso es lo que ocurre en Fundacin, donde el protagonista intenta reducir
la etapa de caos de treinta mil aos prevista por sus anlisis a solo mil.
Y entonces? Lleg el momento de la psicohistoria? Se ha logrado reunir, procesar y ex
plotar los datos suficientes como para leer el futuro y operar estadsticamente so
bre l? El poder de los datos masivos (o Big Data) combinados con una inteligencia
artificial que aprende por prueba y error han dado pruebas de su capacidad tant
o para prever el comportamiento humano como para modificarlo: ya se utiliza para
ofrecer productos solo a potenciales compradores, disputar una agenda meditica y
tambin para influir en las elecciones. Las manipulaciones mediticas, la publicida
d a gran escala e indiferenciada pese a todos sus xitos para generar compras, vot
os y climas sociales, parecen torpes intentos primitivos comparadas con lo que e
st llegando.
Estadstica mata entendimiento
Google, Facebook, Amazon, entre otros, comprobaron hace ya mucho el poder de los
datos y sobre ellos montaron un meterico imperio en una dcada y media. Otros como
Microsoft o Apple, fundados sobre otros modelos, timonearon presurosos sus barc
os hacia la nueva tierra prometida.
Algunos ejemplos ya son conocidos: Google Translate, lanzado en 2006, se dedic a
la dificultosa tarea de traducir todo lo que le dieran. La corporacin no contrat a
miles de lingistas y traductores, sino a ingenieros (en su mayora monolinges), par
a que crearan algoritmos. Estas frmulas basadas en rdenes lgicas son la base de la
inteligencia artificial cuya caracterstica principal es su capacidad de aprender
por medio de prueba y error para mejorar sus resultados. Para comenzar se los al
iment con miles de libros (acumulados a travs de Google Books, por cierto) en dist
intos idiomas. Los algoritmos comenzaron no solo a entender cmo se remplazaba cada
palabra en otro idioma, sino tambin a ver cmo esas relaciones variaban segn el cont
exto: obviamente estas frmulas no entienden lo que hacen, o hablan los idiomas que
traducen, pero logran mejorar constantemente sus resultados gracias a la fuerza
bruta de las estadsticas. Al soltar ese algoritmo en la selva de la red y pregunt
ar si las traducciones sirvieron o no a los usuarios, es solo cuestin de tiempo h
asta que el sistema mejore lo suficiente.
bigdata_izquierda_3
Otro: Amazon, cuya primera innovacin fue la posibilidad de vender libros online,
tambin comprendi a tiempo el valor de los datos acumulados. Una de las vetas que e
ncontr en sus discos duros fue la de sugerir nuevos productos a los clientes en b
ase a sus compras anteriores. En un primer momento contrat a especialistas en lit
eratura, pero cuando comenz a utilizar algoritmos las ventas mejoraron y se hicie
ron tan fcilmente escalables que los egresados de letras debieron partir junto co
n los traductores remplazados por Google.
La lengua, con sus reglas particulares es (o era) uno de los campos ms difciles pa
ra que las frmulas matemticas pudieran aportar algo y, de hecho, an hoy las traducc
iones distan de ser perfectas y confiables. En otros campos con variables comple
jas pero finitas, como el ajedrez, hace aos que las computadoras vencen a los gra
ndes maestros. En marzo de 2016 el algoritmo de Google AlphaGo dobleg y dej perple
jo al gran maestro de Go Lee Se-dol: ese juego milenario era considerado una bar
rera para las computadoras debido a su complejidad. Segn el maestro, el programa
jug un partido perfecto, algo que no es de extraar porque estaba alimentado por mi
les de partidas y jugando con Se-dol sigui aprendiendo. Una vez ms, solo era cuest
in de tiempo. Y ser cada vez menos: los procesadores aumentan su velocidad.
Los gures del Big Data sealan que si se cruzan suficientes datos todo parece posib
le: las historias clnicas de todos los pacientes del planeta podran encontrar patr
ones capaces de, por ejemplo, descubrir interacciones medicamentosas puntuales e
imposibles de detectar por un solo mdico o en un hospital. Un relevamiento perma
nente de las empresas de transporte con sensores dispersos en un colectivo adivin
aran qu pieza ser la prxima en romperse y reducir accidentes y gastos. Los ejemplos p
odran seguir: los autos que se manejan solos sern, tarde o temprano, ms seguros que
los manejados por humanos; las grillas de electricidad administrarn los recursos
de la mejor manera para no desperdiciar nada; la distribucin eficiente de bicicl
etas en la ciudad y ms.
Ciencias Sociales
Hay un lmite para seguir asignando tareas a los algoritmos? Cul es? La educacin? La ge
tin democrtica? La respuesta es incierta y tal vez el significado mismo de esas mi
smas palabras cambie con la intervencin del Big Data y la inteligencia artificial
. Como explica el alemn y Doctor en Comunicacin Martin Hilbert en una excelente en
trevista reciente: [La disponibilidad de Big Data] convirti a las ciencias sociale
s, de las que siempre se burlaron, en la ciencia ms rica en datos. [ ] Nosotros nun
ca tuvimos datos, y por eso nunca funcionaban las polticas pblicas. Y de la noche
a la maana, el 95% de los sujetos que estudiamos pas a tener un sensor de s mismo 2
4 horas al da. Los bilogos siempre dijeron eso no es ciencia, no tienen datos . Pero
ellos no saben dnde estn las ballenas en el mar. Hoy nosotros s sabemos dnde estn las
personas, pero tambin sabemos qu compran, qu comen, cundo duermen, cules son sus ami
gos, sus ideas polticas, su vida social .
Google puede vaticinar el prximo xito cinematogrfico: saben que en promedio cerca d
e trece bsquedas relacionadas con una nueva pelcula se traducen en una entrada ven
dida. Facebook conoce cunto tiempo dedicamos a leer noticias polticas o memes de g
atos, adems de a qu hora lo hacemos y si preferimos los gatos que postea algn amigo
en especial. Esos datos se usan para mantenernos cmodos, interesados y, sobre to
do, generar millones y millones de dlares en avisos: las corporaciones 2.0 son, e
n realidad, agencias de publicidad que utilizan los datos que les brindamos para
vender espacios en el costado de nuestra pantalla a los avisadores. El flujo de
visitas, adems, se mantiene no porque produzcan atractivos contenidos como debe
hacer (costosamente) un medio tradicional, sino que somos los supuestos usuarios
quienes los generamos. Y lo hacemos gratis. No tienen aviones, fbricas, minerale
s o soja. Qu tienen que les permite obtener ganancias comparables a las de Exxon,
Chrysler o AT&T y sus estructuras monstruosas? Datos y la capacidad de analizarl
os.
Aunque no los veamos, los datos estn en todos lados si uno es suficientemente gra
nde y puede procesarlos. En 2004 Walmart comenz a explotar activos acumulados a l
os que nunca haba prestado atencin: el registro de sus ventas de los ltimos aos. Par
a eso contrat a un equipo especializado en Big Data que gener algoritmos capaces d
e buscar correlaciones entre datos propios y otros disponibles. Por ejemplo, al
contrastar sus ventas con las condiciones meteorolgicas descubri que ante la amena
za de huracanes aumentaban sus ventas de pilas y Pop-Tarts, una suerte de galleta
s rellenas. Aunque ni Walmart ni sus ingenieros tengan idea de por qu ocurre, col
ocan las Pop-Tarts en la cabeza de la gndola cada vez que hay amenaza de huracane
s.
Resultados, no hiptesis. Los por qu , si a alguien le interesan, quedarn para despus: m
ientras tanto la validez del algoritmo se mide en dinero. Y tambin en votos (que
tambin se traducen en distribuciones ms justas o menos justas del dinero).
Tocar la realidad
El deseo de conocer, modificar y controlar el comportamiento social ha existido
durante siglos. El desarrollo de un mercado de masas, la expansin de la democraci
a y el voto, la planificacin sanitaria o de transporte, entre otras cosas han for
zado a la implementacin de recursos ms precisos a la hora de medir e influir sobre
el comportamiento de la sociedad.
Las muestras sobre las que trabajaban las encuestadoras, los publicistas y hasta
algunos medios de comunicacin estn pasadas de moda: hay suficientes datos como pa
ra endurecer los anlisis alimentndolos de Big Data. Redes sociales como Facebook o
Twitter permiten conocer los intereses de millones de personas en tiempo real,
a qu estmulos responden, cundo se conectan, con quines interacta y ms. Al cruzar esa e
norme cantidad de datos con las que tienen, por ejemplo, las tarjetas de crdito o
los resultados electorales, se puede medir casi todo: En los barrios donde gana
la derecha leen ms noticias sobre motochorros? Quienes buscan vacaciones baratas s
on los mismos que sacan pasajes? A dnde van? Cundo? Pagan en cuotas? Queremos saber el
perfil de los que circulan por el frente de nuestro negocio? Podemos comprrselo
a Google, que almacena el recorrido de los celulares con Android que pasan por l
a puerta.