Howard - Arte y Ciencia Del Periodismo de Datos
Howard - Arte y Ciencia Del Periodismo de Datos
Howard - Arte y Ciencia Del Periodismo de Datos
Un informe Tow/Knight
Síntesis ejecutiva
Los periodistas han estado utilizando datos en sus artículos desde que existe la
profesión. Una revolución en la computación en el siglo XX creó oportunidades
para la integración de datos a las investigaciones, cuando los periodistas
incorporaron la nueva tecnología a su trabajo. En el siglo XXI una revolución en la
conectividad está conduciendo a los medios hacia nuevos horizontes. Internet, la
computación en la nube, el desarrollo ágil, los dispositivos móviles y el software de
código abierto han transformado la práctica del periodismo, dando origen a un
nuevo término: el periodismo de datos.
Si bien los periodistas han estado usando datos en sus artículos desde que
comenzaron a dedicarse a informar, el periodismo de datos es más que el
periodismo tradicional con más datos. Pasadas décadas desde que los primeros
pioneros aplicaron exitosamente la información asistida por computadoras y las
ciencias sociales al periodismo de investigación, los periodistas están creando
aplicaciones de noticias y recursos interactivos que ayudan a la gente a
comprender los datos, explorarlos y actuar a partir de la nueva comprensión que
obtienen de ello. Están surgiendo nuevos modelos de negocios en los que los
datos son una materia prima para obtener ganancias, impacto y comprensión, co-
creada con un público que antes estaba limitado al consumo pasivo. Periodistas
de todo el mundo se encuentran con el entusiasmo y el desafío de narrar historias
atrapantes dominando la vasta cantidad de datos que nuestras vidas, dispositivos,
empresas y gobiernos, cada vez más interconectados, producen diariamente.
El potencial del periodismo de datos es inmenso, pero los obstáculos y desafíos
que implican su adopción en todos los medios son igualmente significativos, desde
el grado de alfabetización digital hasta la competencia por recursos escasos en las
redacciones. Amenazas globales a la libertad de prensa, la seguridad digital y
acceso limitado a los datos crean difíciles condiciones de trabajo para los
periodistas en muchos países. Sin embargo, una combinación de aprendizaje
entre pares, esponsoreo, capacitación online, iniciativas de información abierta, y
nuevos programas en escuelas de periodismo que se ponen a la altura del
desafío, ofrecen motivos para ser optimistas respecto de que más periodistas
aprendan a tratar los datos como una fuente de información.
Recomendaciones y Predicciones
1) Los datos se volverán un recurso aún más estratégico para los medios.
2) Surgirán mejores herramientas que democratizarán las capacidades para el
manejo de datos.
3) Las aplicaciones de noticias se impondrán explosivamente como el modo
primordial en que la gente consuma periodismo de datos.
4) Ser digital significa en primer lugar ser data-céntrico y facilitar el acceso a través
de mobile-friendly (dispositivos móviles)
5) Esperar más periodismo robótico [“Robot Journalism”], pero saber que las
relaciones y la capacidad de narración humanas aún importan.
6) Más periodistas tendrán que estudiar ciencias sociales y estadísticas.
7) Se le exigirá al periodismo de datos un mayor nivel de precisión y corrección.
8) La capacitación en seguridad y protección de datos se volverá más importante.
9) Los públicos exigirán más transparencia respecto del acopio y utilización de
datos de los lectores.
10) Surgirán conflictos por los registros públicos, data scraping (la extracción de
datos) y la ética.
11) Se dará colaboración con bibliotecas, universidades, archivos, sitios y
educadores.
12) Esperar personalización y noticias predictivas en interfaces “wearable” (en
prendas de vestir y accesorios)
13) Redacciones más diversificadas producirán un mejor periodismo de datos.
14) Estar atentos al ―dataismo‖ [“Dataism”] y a los malos datos, manteniendo una
mirada crítica.
Índice
I. Introducción
II. Historia
a. Visión general
b. Datos en los Medios
c. Ascenso de las Máquinas en la Redacción
d. Periodismo asistido por Computadora
e. Punto de Inflexión de Internet
a. Contexto cambiante
b. El Auge de las Aplicaciones de Noticias
c. Acerca del Empirismo, el Escepticismo y la Confianza del Público
d. Analítica de la Sala de Redacción
e. Modelos de Negocios Basados en Datos
f. Nuevos Ingresos para Organizaciones Sin Fines de Lucro
g. Combustible para el Periodismo Robótico
IV Ejemplos Notables
V. El Camino a la Profesión
Recomendaciones y Predicciones
IX. Apéndices
a. Agradecimientos
b. Sobre el Autor
c. Entrevistas
d. Notas
I. Introducción
Hoy el mundo está inundado de cantidades sin precedentes de datos en una red
en expansión de fuentes de noticias. En 2012, según se estima, se creaban
diariamente 2,5 cuatrillones de bytes de datos, o 2,5 exabytes, con la cifra
aumentando al doble cada 40 meses. (Para tener una referencia, son 115 millones
de iPhones de 16 gigabytes.)
Es un momento extraordinario en muchos sentidos. Toda esa generación de datos
y conectividad han creado nuevas oportunidades y desafíos para las
organizaciones de medios que se han visto sacudidas de un modo fundamental
por Internet.
Parafraseando al autor William Gibson, en muchos sentidos el futuro post-
industrial del periodismo ya está aquí, simplemente no está distribuido de modo
parejo aún.i Ahora amigos, familiares y colegas conectados socialmente
comparten noticias que son transmitidas por aplicaciones y streaming de video a
los que se accede con dispositivos móviles, aplicaciones y tabletas. Las
redacciones ahora son solo un componente, aunque crucial, de un medio-
ambiente dramáticamente diferente de las noticias. Además, no siempre son la
fuente. Las noticias a menudo aparecen primero en las redes sociales, publicadas
por gente cercana a los eventos. A partir de allí son recogidas, compartidas y
analizadas; luego se verifican los hechos y se los sintetiza en periodismo
contextualizado.
Las organizaciones de medios hoy deben ser capaces de poner los datos a
trabajar rápidamente.ii Esta necesidad se demostró ampliamente durante el
huracán Sandy, cuando los datos públicos de gobierno abierto se volvieron una
infraestructura crítica.iii Dada una resolución de la Corte Suprema del 2014 en la
que el jefe de la Corte John Roberts opinó que la difusión a través de bases de
datos online equilibraría el efecto de clasificar las donaciones políticas como
protegidas por la Primera Enmienda de la Constitución, vale la pena enfatizar que
gran parte de la ―tecnología moderna‖ que es un ―medio particularmente efectivo
de armar al público votante con información‖ ha sido creada y mantenida por
periodistas y organizaciones sin fines de lucro.iv
La pregunta que sigue abierta en 2014 no es si los datos, las computadoras y los
algoritmos pueden ser utilizados por los periodistas en interés del público, sino
más bien cómo, cuándo, dónde, por qué y por quién.v Hoy los periodistas pueden
tratar todos esos datos como una fuente, interrogándolos en busca de respuestas
tal como lo harían con un humano.
Ese trabajo es periodismo de datos, o recoger, limpiar, organizar, analizar,
visualizar y publicar datos como soporte para la creación de actos de periodismo.
Una definición más sucinta podría ser simplemente la aplicación de la ciencia de
los datos al periodismo, donde la ciencia de los datos se define como el estudio de
la extracción de conocimientos de los datos.vi
En sus formas más elementales, el periodismo de datos combina:
i
C. Andersen, E. Bell, and C. Shirky, ―Post Industrial Journalism: Adapting to the
Present,‖ Tow Center.
ii
A. Howard, ―Knight Winners Are Putting Data to Work,‖ O‘Reilly Media, 26 de
sep.de 2012, http://strata.oreilly.com/2012/09/knight-news-challenge-data-
winners.html (acceso 3 de febrero de 2015).
iii
A. Howard, ―Tracking the Data Storm Around Hurricane Sandy,‖ O‘Reilly Media,
29 de oct. de 2012, http://strata.oreilly.com/2012/10/real-time-data-storm-in-
hurricane-sandy-open-data.html (acceso 3 de febrero de 2015).
iv
Sunlight Foundation, ―No Justice Roberts, the Internet Can‘t do Government‘s
Job,‖ Sunlight Foundation Blog, 12 de abr. de 2014,
http://sunlightfoundation.com/blog/de 2014/04/02/no-justice-roberts-the-internet-
cant-dogovernments-job/ (acceso 21 de mayo de 2014).
v
A. Howard, ―Data for the Public Good,‖ O‘Reilly Media, 22 de febr. de 2012,
http://strata.oreilly.com/2012/02/data-public-good.html (acceso 3 de febrero de
2015).
vi
M. Loukides, ―What is Data Science?‖ O‘Reilly Radar, 2 de jun. de 2010,
http://radar.oreilly.com/2010/06/what-is-data-science.html (acceso 3 de febrero de
2015).
vii
S. Rogers, ―Data Journalism Only Matters When it's Transparent,‖ Mother Jones,
24 de abr. de 2014, http://www.motherjones.com/media/2014/04/vox-538-upshot-
open-data-missing (acceso 3 de febrero de 2015).
viii
A. Howard, ― NPR News App Team Experiments With Making Data-driven Public
Media With the Public,‖ Tow Center for Digital Journalism, 30 de ag. de 2013,
http://towcenter.org/blog/npr-news-app-team-experiments-with-making-data-driven-
public-media-with-the-public/ (acceso 3 de febrero de 2015).
ix
M. Slocum, ―The Work of Data Journalism: Find, Clean, Analyze, Create…
Repeat,‖ O‘Reilly Media, 15 de sep. de 2011, http://strata.oreilly.com/2011/09/data-
journalism-process-guardian.html (acceso 3 de febrero de 2015).
x
L. Bounegru, L. Chambers, and J. Gray, eds., The Data Journalism Handbook
(Sebastopol, Calif.:O‘Reilly Media, 2012), http://datajournalismhandbook.org/
(acceso 3 de febrero de 2015).
II. Historia
a. Visión general
Para mediados del siglo XX, el periodismo de investigación contaba con equipos
de periodistas profesionales estudiando estadísticas oficiales, registros judiciales,
e informes empresarios obtenidos a través de la visita a edificios estatales,
archivos y polvorientos sótanos de las cortes de justicia; u obteniendo documentos
confidenciales por vías oficiales o por filtraciones. Estas listas de cifras y cuentas
en los libros y gabinetes de archivos de las burocracias del mundo siempre han
sido una fuente rica en datos, mucho antes de que los datos pudieran publicarse
en formato digital y compartirse instantáneamente en todo el mundo.
El periodismo fundado en bases de datos llegó a la mayoría de las redacciones
realmente hace más de tres décadas, cuando las micro-computadoras se
volvieron comunes en la década de 1980, aunque los primeros pioneros usaban
tarjetas perforadas. Cuando las computadoras se volvieron accesibles en términos
físicos, tanto como económicos para las redacciones, sin embargo, el modo en
que podían usarse los datos cambió la forma en que se realizaban las
investigaciones y mucho más. Antes que la primera laptop entrara en la redacción,
los periodistas y editores con inclinaciones técnicas ya habían encontrado que
procesar cifras en computadoras grandes (mainframe), microcomputadoras y
servidores permitía un periodismo de investigación más poderoso.
d. Periodismo asistido por Computadora
Mientras que las variadas historias del desarrollo del periodismo asistido por
computadoras ofrecen un contexto para el trabajo actual, la mayoría de los
historiadores ubican sus comienzos en la segunda mitad del siglo XX. xxx Los
observadores casuales pueden no advertir que muchos aspectos de lo que ahora
se llama frecuentemente periodismo de datos son descendientes evolutivos
directos de décadas de periodismo asistido por computadora (PAC) en Estados
Unidos. De hecho la pionera de la computación Grace Hopper, profesora y vice-
almirante de la Marina de los Estados Unidos en la II Guerra Mundial, hizo
predicciones previsoras mucho antes de que los pronósticos electorales de Nate
Silver lo convirtieran en una estrella de los medios.
Es famoso que en 1952 CBS utilizó una computadora mainframe, una Remington
Rand UNIVAC, y modelos estadísticos para predecir el resultado de la elección
presidencial.xxxi Mientras tanto Grace Hopper trabajó con un equipo de
programadores alimentando a la ENIAC con estadísticas del voto de elecciones
anteriores y escribió algoritmos que permitieron a la computadora predecir
correctamente el resultado.
El modelo que construyó no solo predijo acertadamente el resultado final -una
victoria abrumadora de Dwight D. Eisenhower- con solo el 5 por ciento del
recuento realizado, sino que lo hizo con un margen del uno por ciento (sus
cálculos predijeron 83,2 por ciento de votos electorales para Eisenhower; en
realidad recibió el 82,4 por ciento). Grace Hopper y su equipo usaron la ENIAC
para lograr algo bastante similar a lo que Nate Silver hace seis décadas después:
desafiar las predicciones electorales de los comentaristas políticos usando
modelos estadísticos.
[Diseñador de UNIVAC J. Presper (―Pres) Eckert y el operador Harold Sweeney
muestran la computadora al presentador de CBS Walter Cronkite. Crédito de la
foto: Wikimedia Commons.]
En los años que siguieron a este evento señero de los medios, el cambio fue lento,
marcado por la experimentación de los pioneros con el periodismo asistido por
computadora en investigaciones. Pasaron casi dos décadas antes de que pioneros
del PAC como Meyer Elliot Jaspin y Philip Meyer comenzaran a trabajar con
computadoras mejores y más rápidas, recogiendo y analizando datos para el
periodismo de investigación. Luego de que le otorgaran el título de Nieman Fellow
de la Universidad de Harvard a fines de la década de 1960 para estudiar la
aplicación de métodos cuantitativos utilizados en las ciencias sociales, Philip
Meyer propuso aplicar estos métodos de investigación de las ciencias sociales al
periodismo usando computadoras y programación. Lo llamó ―periodismo de
precisión, e incluía prácticas bien fundadas para la recolección y muestreo de
datos, el análisis cuidadoso y la presentación clara de los resultados de la
investigación‖.xxxii
Meyer en forma subsecuente aplicó esa metodología a investigar las causas
xxxiii
subyacentes a los disturbios en Detroit en 1967, aporte que fue citado cuando
la Detroit Free Press ganó el premio Pulitzer al Periodismo General Local el año
siguiente. El análisis de Meyer mostró que los graduados universitarios fueron tan
proclives a participar en los disturbios como quienes no habían terminado la
escuela secundaria, refutando una teoría popular que relacionaba el status
económico y educativo con la propensión a actuar en disturbios, y otra que se
refería a inmigrantes del sur de Estados Unidos. Las investigaciones de Meyer
concluyeron que las causas fundamentales de los disturbios de Detroit fueron la
falta de empleo, la falta de buenas viviendas, las condiciones de hacinamiento en
los hogares y la brutalidad policial.
En las siguientes décadas periodistas de todo el país exploraron y expandieron a
paso firme las formas en que los datos y su análisis podían ser utilizados para
informar a los lectores a través del periodismo. Las microcomputadoras y las
computadoras personales cambiaron la práctica y las formas del PAC
significativamente al expandirse las herramientas y los medios disponibles para los
periodistas. Más gente comenzó a ser consciente de que la ―gente de las noticias
recurre a las máquinas‖ como dijo la revista Time en 1996.xxxiv Para comienzos de
la década de 1990, los periodistas estaban usando técnicas y bases de datos de
PAC en muchas investigaciones en Estados Unidos y más allá.
El periodismo basado en datos se volvió cada vez más significativo en el trabajo
de los ganadores del premio más prestigioso de la profesión: Desde el Pulitzer de
Eliot Jaspin en el Providence Journal en 1979, hasta el trabajo de Chris Hambly en
el Center for Public Integrity (Centro para La integridad Pública) en 2014, el PAC
ha influido en artículos importantes.xxxv
Brant Houston, ex director ejecutivo de Investigative Reporters and Editors (IRE,
Reporteros y Editores de Investigación), dijo en una entrevista:
La práctica del PAC ha cambiado con el tiempo junto con el cambio en las
herramientas y el medio del mundo digital. Comenzó en los tiempos de los
mainframes a fines de la década de 1960 y avanzó a las PC (que incrementaron la
velocidad y la flexibilidad del análisis y la presentación) y luego a la Red, lo que
aceleró la capacidad de reunir, analizar y presentar datos. Los objetivos básicos
siguen siendo los mismos. Sacudir los datos y encontrarles sentido, a menudo con
métodos de las ciencias sociales. El PAC tiende a ser un término paraguas que
incluye el periodismo de precisión y el periodismo basado en datos y cualquier
metodología que le encuentre sentido a los datos, tales como la visualización y
presentaciones efectivas de datos.
Para 2013, el PAC había sido reconocido como una disciplina periodística
importante como lo exploró la subdirectora del Tow Center, Susan McGregor el
año pasado en un artículo en el Columbia Journalism Review.xxxvi Los datos se
habían convertido no solo en parte integral de muchas investigaciones premiadas,
sino también en la materia prima de aplicaciones, visualizaciones, obtención de
público, de ganancias y primicias impactantes.
Dada la universalidad del uso de las computadoras hoy en día en los medios, el
término periodismo asistido por computadora ahora parece anticuado, heredado
de un tiempo en que las computadoras eran una novedad en las redacciones.
Probablemente no haya un solo reportero o editor que trabaje en una redacción en
Estados Unidos o Europa hoy, que al fin de cuentas, no use una computadora en
el curso de su periodismo.
De hecho, muchos miembros de los medios pueden usar varias durante el día,
desde las poderosas computadoras de mano que llamamos teléfonos inteligentes,
pasando por el desarrollo de análisis o transformaciones en laptops y
computadoras de escritorio, hasta apoyarse en servidores y el almacenado en la
nube para procesar grandes cantidades de datos a escala de Internet.
Scott Klein señalaba todo lo que ha cambiado desde los tiempos pioneros de
Philip Meyer de los años sesenta:
Sin duda había grandes informes, pero eran más raros los recursos interactivos y
las visualizaciones de datos. Ahora el periodismo de datos es una especialidad de
mucho más alcance. Los periodistas de datos informan y escriben, idean recursos
interactivos y visualizaciones, desarrollan plataformas para informar, desarrollan
modelos predictivos, programan software de código abierto, y mucho, mucho más.
El ritmo realmente se ha acelerado, y es el motivo por el que ser autodidacta es
tan importante.
Estas siguen siendo herramientas relativamente nuevas y poderosas, justifican el
entusiasmo respecto de su aplicación, y generan un comprensible escepticismo
respecto de cuánto incidirán si los periodistas que las utilizan o sus editores no
promueven el desarrollo de la capacitación digital. Lo digital trae consigo
preocupaciones respecto de potenciales problemas de privacidad, seguridad y
sustentabilidad que dependen de terceros.
xi
Ibid.
xii
S. Rogers, ―Facts Are Sacred: the Power of Data,‖ The Guardian, 6 de en. de 2012,
http://www.theguardian.com/news/datablog/2012/jan/06/facts-sacred-guardian-shorts-
ebook (acceso 3 de febrero de 2015).
xiii
Ibid.
xiv
J. Townend, ―#DataJourn Part 1: A New Conversation (Please Re-tweet),‖ Editors Blog,
Journalism.co.uk, 8 de abr.de 2009, http://blogs.journalism.co.uk/2009/04/08/datajourn-
part-1-a-new-conversation-please-re-tweet/ (acceso 3 de febrero de 2015).
xv
P. Bradshaw, ―Model for the 21st Century Newsroom pt.6: New Journalists for New
Information Flows,‖Online Journalism Blog, 4 de dic de. 2008,
http://onlinejournalismblog.com/2008/12/04/model-for-the-21st-century-newsroom-pt6-
new-journalists-for-new-information-flows/ (acceso 3 de febrero de 2015).
xvi
T. Hirst, ―Personal Recollections of the ‗Data Journalism‘ Phrase,‖ OUsefulInfo, 29 de
abr. de 2014, http://blog.ouseful.info/2014/04/29/personal-recollections-of-the-data-
journalism-phrase/ (acceso 3 de febrero de 2015).
xvii
M. Ingram, ―The Golden Age of Data Journalism?‖ Nieman Journalism Lab, mayo de
2009, http://www.niemanlab.org/2009/05/the-golden-age-of-computer-assisted-reporting-
is-at-hand/ (acceso 3 de febrero de 2015).
xviii
A. Holovaty, ―A Fundamental Way Newspaper Sites Need to Change,‖
adrianholovaty.com, 2006, http://www.holovaty.com/writing/fundamental-change/ (acceso
3 de febrero de 2015).
xix
M. Waite, ―Announcing PolitiFact,‖ mattwaite.com, 22 de ag.de 2007,
http://www.mattwaite.com/posts/2007/aug/22/announcing-politifact/ (acceso 3 de febrero
de 2015).
xx
―PolitiFact Wins Pulitzer,‖ PolitiFact, 20 abril 2009, http://www.politifact.com/truth-o-
meter/article/2009/apr/20/politifact-wins-pulitzer/ (acceso 3 de febrero de 2015).
xxi
C. Arthur, ―Analysing Data is the Future for Journalists, Says Tim Berners-Lee,‖ The
Guardian, 22 de nov. de 2010, http://www.theguardian.com/media/2010/nov/22/data-
analysis-tim-berners-lee (acceso 3 de febrero de 2015).
xxii
UK Parliament, ―Pay and Expenses for MPs,‖ Parliament.uk, abril de 2014,
http://www.parliament.uk/about/mps-and-lords/members/pay-mps/ (acceso 3 de febrero de
2015).
xxiii
C. Arthur, ―Visualising MP Expenses,‖ The Guardian, 1 de abr. de 2009,
http://www.theguardian.com/news/datablog/2009/apr/01/mps-expenses-houseofcommons
(acceso 3 de febrero de 2015).
xxiv
S. Rogers, ―Wikileaks‘ Afghanistan War Logs: How our Data Journalism Operation
Worked,‖ The Guardian, 27 de jul. de 2010,
http://www.theguardian.com/news/datablog/2010/jul/27/wikileaks-afghanistan-data-
datajournalism (acceso 3 de febrero de 2015).
xxv
A. Howard, ―In the Age of Big Data, Data Journalism has Profound Importance for
Society,‖ Radar, O‘Reilly Media, mzo.de 2012, http://strata.oreilly.com/2012/03/rise-of-the-
data-journalists.html (acceso 3 de febrero de 2015).
xxvi
D. Kaplan, ―Data Journalists from 20 Countries Gather for Cutting-Edge NICAR14,‖
Global Investigative Journalism Network, 3 de mzo. de 2014,
http://gijn.org/2014/03/03/data-journalists-from-20-countries-gather-for-cutting-edge-
nicar14/ (acceso 3 de febrero de 2015).
xxvii
Associated Press, ―The Overview Project,‖ mayo de 2014,
http://overview.ap.org/completed-stories/ (acceso 3 de febrero de 2015).
xxviii
N. Diakopoulas, ―Algorithmic Accountability Reporting: On the Investigation of Black
Boxes,‖ Tow Center for Digital Journalism, febr. de 2014,
http://towcenter.org/research/algorithmic-accountability-on-the-investigation-of-black-
boxes-2/ (acceso 3 de febrero de 2015).
xxix
A. Howard, ―Publishers Can Afford Data Journalism, Says ProPublica‘s Scott Klein,‖
Tow Center for Digital Journalism, 23 de abr. de 2014, http://towcenter.org/publishers-can-
afford-data-journalism-says-propublicas-scott-klein/ (acceso 3 de febrero de 2015).
xxx
M. Cox, ―The Development of Computer-Assisted Reporting,‖ School of Communication,
University of Miami, http://com.miami.edu/car/cox00.htm (acceso 22 de mayo de 2014).
xxxi
A. Bochannek, ―Have You Got a Prediction for Us, UNIVAC?‖ Computer History
Museum, dic. de 2012, http://www.computerhistory.org/atchm/have-you-got-a-prediction-
for-us-univac/ (acceso 3 de febrero de 2015).
xxxii
P. Meyer, The New Precision Journalism (Bloomington: Indiana University Press,
1991), http://www.unc.edu/~pmeyer/book/ (Prólogo acceso 3 de febrero de 2015).
xxxiii
G. Younge, ―The Detroit Riots of 1967 Hold Some Lessons for the UK,‖ The Guardian,
5 de sep. de 2011, http://www.theguardian.com/uk/2011/sep/05/detroit-riots-1967-lessons-
uk (acceso 3 de febrero de 2015).
xxxiv
E. Bowen, ―Press: New Paths to Buried Treasure,‖ Time, 7 de jul. de 1986,
http://content.time.com/time/magazine/article/0,9171,961680-1,00.html (acceso 3 de
febrero de 2015).
xxxv
Pulitzer.org, ―The Pulitzer Prizes, de 2014,‖ de 2014,
http://www.pulitzer.org/citation/2014-Investigative-Reporting (acceso 3 de febrero de
2015).
xxxvi
S. MacGregor, ―CAR Hits the Mainstream,‖ Columbia Journalism Review, 18 de mzo.
de 2013, http://www.cjr.org/data_points/computer_assisted_reporting.php?page=all
(acceso 3 de febrero de 2015).
III. Por qué Importa el Periodismo de Datos
a. Contexto cambiante
Por tanto puede ser útil diferenciar entre el procedimiento y el producto, como lo
ha hecho Susan McGregor:
Las aplicaciones de noticias ―son buenísimas para narrar historias y localizar los
datos, pero necesitamos más esfuerzos para humanizar y explicar los datos‖ dijo
Momi Peralta de La Nación. Y señaló:
Este sistema de valores, para los que tanto los datos como el código detrás de un
artículo están abiertos al público para su examen, es algo que he escuchado citar
frecuentemente a los principales practicantes del periodismo de datos de todo el
mundo. Del mismo modo que los programadores de código abierto muestran su
trabajo cuando presentan software actualizado a través de GitHub, los periodistas
de datos están publicando actualizaciones de conjuntos de datos que acompañan
artículos o aplicaciones de noticias.
Esta capacidad de publicar datos no cambia la ética subyacente o la
responsabilidad que los periodistas sostienen: No todos los datos pueden o deben
ser publicados en tales trabajos, en particular, información atribuible
personalmente o detalles que expondrían a quienes hacen denuncias o pondrían
en riesgo la vida de fuentes.
Algunos de los periodistas de datos entrevistados expresaron una clara
preferencia por crear aplicaciones de noticias que sean nativas a la red, por
oposición a una aplicación desarrollada para un dispositivo que funciona con iOS o
Android. La idea es que si los medios sin fines de lucro o públicos quieren servir a
todos los usuarios, eso significa publicar en modos accesibles que no requieran
planes de acceso a Internet o dispositivos móviles costosos. Las aplicaciones de
noticias basadas en código abierto y estándares abiertos pueden diseñarse para
que funcionen en múltiples plataformas móviles y que no estén sujetas a la
aprobación de una compañía de tecnología para su inclusión en la lista de una
tienda de aplicaciones.
Aunque las herramientas y el contexto hayan evolucionado, las metas básicas del
periodismo basado en datos se han mantenido iguales a lo largo de las décadas,
observó Brant Houston, ex director ejecutivo de Investigative Reporters and
Editors (Reporteros y Editores de Investigación). ―Filtrar los datos y encontrarles
sentido, a menudo con métodos de las ciencias sociales‖, dijo. Plataformas de
código abierto para la recolección, almacenado, análisis y publicación de
cantidades inmensas de datos se integran hoy con un pensamiento riguroso,
principios sólidos de diseño, narrativas poderosas y técnicas de información
creativas para producir actos de periodismo.
En términos realistas, las prácticas solo cambian si hay incentivos para ello. Los
científicos académicos no consiguen cargos sobre la base de escribir blogs con
mucho tráfico o artículo de alta calidad para Wikipedia, se los promueve por
publicar investigaciones rigurosas en medios competitivos, con revisión de sus
pares. Del mismo modo, los periodistas son promovidos por ofrecer material
suplementario cuidadosamente documentado o por replicar otros análisis en vez
de contribuir a la cobertura de un evento noticioso importante. En medio de las
actuales ansiedades respecto de la sobrecarga de información, así como de la
transformación en armas de tácticas destinadas a provocar temor, incertidumbre y
duda, el periodismo basado en datos podría tener un rol crucial de darle bases
empíricas a nuestras discusiones de políticas, tendencias económicas y cambios
sociales. Pero a menos que los nuevos líderes establezcan y hagan aplicar
estándares que emulen las normas de la comunidad científica, este periodismo de
datos corre el riesgo de caer en trampas que pueden socavar la confianza del
público y de la comunidad científica.
Keegan sugirió varios principios sólidos a ser adoptados por los periodistas de
datos: datos abiertos, deliberación abierta, colaboración abierta y ombudsmen
(defensores) de los datos:
Como reconoció Pilhofer, esta es una lección que los editores online comenzaron
a aplicar hace una década. Es hora de ponernos al día. ―Escuchar a los lectores
es tan viejo como publicar cartas al editor‖, escribió Owen Thomas, jefe de
redacción de ReadWrite. ―Lo nuevo es que la analítica de la red crea una
conversación implícita que es tan interesante como la explícita que logramos tener
desde hace mucho.‖lxiii
El periodismo de datos y las bases de datos en las que se basa, también ofrecen
medios muy mejorados para organizar y acceder a fuentes de materiales a lo largo
del tiempo. No es una cuestión menor: las redacciones y las organizaciones de
medios están sujetas a los mismos desafíos respecto del manejo de
conocimientos y la colaboración que otras organizaciones en el siglo XXI. El
McKinsey Global Institute estima que los trabajadores del conocimiento dedican el
20 por ciento de su tiempo a tratar de encontrar información.lxiv
Dado que esta actividad es central a la tarea de los periodistas, mejorar la
colaboración por medio de software social y material de fuentes digitales condensa
el tiempo que lleva investigar, editar y publicar un tema. Como editores en el
mundo de los negocios, la tecnología y las finanzas saben muy bien que eso
puede significar dinero real, y estabilizar los ingresos, encontrar nuevas fuentes de
ganancias y está muy presente en las mentes de los editores en estos tiempos.
El informe del Estado de los medios para 2013 del Proyecto del Pew Research
Center (Centro de Investigaciones Pew) para la Excelencia en el Periodismo, pintó
un cuadro de contracción, con cierres de redacciones y un mercado de publicidad
digital dominado por gigantes de la tecnología como Facebook y Google. lxv A lo
largo de la última década ha estado bien documentada la conmoción provocada
por Internet en los modelos tradicionales de negocios de los diarios. Más de 166
diarios de EE.UU. de un total estimado en 1382 han dejado de tener una edición
impresa o cerraron por completo desde 2008,lxvi resultando en la pérdida de más
de 40.000 puestos de trabajo o compras de empresas del sector desde 2007.lxvii
No hay vuelta a los tiempos en que los diarios disfrutaban de monopolios locales
de publicidad y tampoco a márgenes de ganancias del 20 por ciento. Craigslist,
eBay y Monster.com se han convertido en plataformas para los ingresos por
avisos clasificados que en un tiempo sostenían a los diarios locales. Desde
entonces no ha emergido un modelo de negocios único para los medios que
pueda copiarse en la era de la información, aunque se han realizado literalmente
cientos de paneles, conferencias y coloquios para debatir la cuestión.
Los problemas económicos siguen siendo más agudos a nivel regional, donde los
diarios enfrentan el difícil desafío de conseguir que los consumidores paguen por
las noticias de ayer. Publicar o republicar columnas de datos por sí solo no los
rescatará. Por ejemplo, uno de los casos canónicos de noticias basadas en datos,
EveryBlock, nunca terminó de imponerse. El sitio, descripto razonablemente como
el ―Xerox PARC de los datos cívicos‖lxviii fue adquirido por MSNBC en 2009,
expandido y reorientado a la creación de notas comunitarias, además de ofrecer
datos locales a lo largo de los años.
En 2013, NBC News cerró EveryBlock,lxix argumentando problemas con su modelo
de negocios. EveryBlock enfrentó otros problemas fundamentales: Pese a su
rediseño en 2011, que integró más elementos y temas sociales, los datos locales
que eran la base del servicio, no se demostraron lo suficientemente contundentes
para atraer visitantes diarios de manera consistente como para sostener el sitio.
Las páginas de datos no bastaban para atraer al público por sí mismas.
EveryBlock necesitaba más narrativas y artículos de interés humano para hacer
que la gente volviera por más, comprometiéndose en su participación y en la
creación de una comunidad.
En 2014, se relanzó EveryBlocklxx solo en Chicago continuando el experimento;
sin embargo las esperanzas de que la plataforma se convierta en la arquitectura
cívica para unir a vecindarios con otras zonas se han reducido considerablemente.
En cambio, redes sociales privadas como Nextdoor o Facebook, boletines como
Craigslist y aplicaciones móviles que vendrán tienen más probabilidades de
ayudar a los vecinos a conectarse entre sí o con servicios locales.
Los problemas que sitios hiperlocaleslxxi como Patch.com y de noticias localeslxxii
en general han enfrentado en la búsqueda de un modelo de negocios han dejado
a muchos observadores preguntándose qué puede funcionar.lxxiii Luego de una
venta y una nueva administración que redujo el personal en un 85 por ciento y que
cambió la estrategia de las ventas de publicidad local a cuentas nacionales, Patch
va camino de alcanzar la rentabilidad en 2014 con 17 millones de visitantes
individuales en 906 sitios en abril de 2014.lxxiv
En ese contexto, las empresas editoriales y los editores tienen difíciles decisiones
por delante respecto de qué recortar y en qué invertir. Pese a la promesa del
periodismo basado en datos y su importancia en el ambiente de las noticias
digitales, algunos siguen optando por cerrar las divisiones dedicadas a los datos.
Digital First Media, por ejemplo, ―cerró su Proyecto Thunderdome‖ en abril de
2014.lxxv Como señaló Ken Doctor en un articulo para el Nieman Lab,lxxvi
Thunderdome era una nueva firma digital prometedora dentro de una compañía de
medios mucho más grande, que producía materiales de video basados en datos
sólidos, como ―Firearms in The Family‖lxxvii (Armas de fuego en la familia),
―Decoding the Kennedy Assassination‖lxxviii (Decodificar el asesinato de Kennedy) y
un asesor impositivo para responder a las urgencias del cierre del año fiscal.lxxix
Doctor escribió que la decisión de cerrar Thunderdome, sin embargo, fue motivada
más por reducción de costos por parte del dueño mayoritario de Digital First
Media, Alden Global Capital, que por el éxito o fracaso de la unidad.
El gran mercado mundial que se está abriendo actualmente tiene que ver con la
transformación de datos disponibles al público en algo que podamos procesar:
hacer visibles los datos y hacerlos humanos. Queremos poder relacionarnos con
las grandes cifras que escuchamos todos los días en las noticias, qué significan
los millones y miles de millones para cada uno.
Hay una cantidad de compañías de medios basadas en datos muy rentables que
simplemente han aplicado este principio antes que otras. Disfrutan de tasas de
crecimiento saludables y en algunos casos ganancias llamativas. Un ejemplo:
Bloomberg. La compañía opera alrededor de 300.000 terminales y entrega datos
financieros a sus usuarios. Si usted está en el negocio del dinero esta es una
herramienta poderosa. Cada terminal viene con un teclado con código de colores y
hasta 30.000 opciones para buscar, comparar, analizar y ayudarlo a decidir qué
hacer a continuación. Este negocio central genera unos US$ 6.300 millones
estimados al año, al menos es lo que calculó un artículo del New York Times de
2008. Como resultado de ello, Bloomberg ha estado contratando periodistas por
todas partes; compraron la venerable Business Week que daba pérdidas, y así
siguiendo.
Otro ejemplo es el conglomerado de medios canadiense conocido hoy como
Thomson Reuters. Comenzaron con un diario, compraron una cantidad de títulos
conocidos del Reino Unido y luego decidieron hace dos décadas dejar el negocio
de los diarios. En cambio han crecido en base a servicios de información,
apuntando a dar a sus clientes una perspectiva más profunda en una cantidad de
sectores. Si a usted le preocupa cómo ganar dinero con información
especializada, el consejo sería leer acerca de la historia de la compañía en
Wikipedia.
Y vean The Economist. La revista ha construido una marca excelente e influyente
por el lado de los medios. Al mismo tiempo la ―Economist Intelligence Unit‖
(Unidad de Inteligencia) es ahora más bien una consultora, informando de
tendencias relevantes y dando pronósticos para casi cualquier país en el mundo.
Emplean cientos de periodistas y dicen atender a alrededor de 1,5 millones de
clientes en todo el mundo.lxxxv
Los datos son un activo estratégico, dada la visión que pueden dar del mundo. Los
datos con propiedad intelectual son un recurso valioso que pueden y de hecho
sostienen modelos de negocios de compañías gigantes. Hay un motivo por el que
los científicos de los datos son un commodity caliente en Silicon Valley, pasando
por Wall Street y hasta en entes de inteligencia en Washington D.C.: pueden crear
conocimiento valioso a partir de grandes cantidades de datos, tanto púbicos como
privados. Del mismo modo, hay un motivo por el que fondos de alto riesgo usan la
Ley de Libertad de Información para comprar datos oficiales:lxxxvi Es inteligencia de
negocios útil para el manejo de inversiones.
Fuera de las democracias occidentales con leyes de libertad de acceso a la
información relativamente bien establecidas y gobiernos que han estado reuniendo
y difundiendo datos desde hace décadas, la promoción de la recolección de datos
puede ser aún más estratégica. Justin Arenstein, un becario de Knight
International que trabaja con la African Media Initiative (AMI, Iniciativa Africana de
Medios) como director para innovación digital, dijo en una entrevista:
Las compañías de medios lo están viendo como una de sus muchas futuras
fuentes potenciales de ingresos. Les permite dar nuevos propósitos a sus propios
datos, empezar a producir libros y demás. No se publican muchos libros escritos
por africanos para africanos en África. De pronto si el contenido está disponible en
un formato accesible les da la oportunidad de mezclar cosas y crear nuevos tipos
de libros.
Comenzarán a ver que el contenido mismo puede ser un modelo de negocios. El
impacto que buscamos allí es tratar de mostrar a compañías de medios que
invertir en información única de alta calidad, en realidad, les da un commodity de
largo plazo del que se puede seguir obteniendo beneficios a lo largo del tiempo.
Mientras que simplemente tomar cables como vienen o, como hacen muchas
compañías de medios en África, simplemente tomarlas de la red, de la BBC u
otras fuentes, y reconocer las fuentes, no es un buen modelo de negocios.lxxxvii
Mientras los modelos de ingresos para las noticias híper locales basadas en datos
o el periodismo algorítmico seguirán evolucionando, prosperando o decayendo,
organizaciones sin fines de lucro como ProPublica o el Texas Tribune operan con
métricas distintas a las ganancias. El Tribune, que ha emergido como un punto
positivo en el firmamento de medios online para gobiernos estaduales, se centra
en cubrir la gobernación texana. Es ahora uno de los ejemplos más importantes de
periodismo de datos en Estados Unidos, dado el éxito de sus visualizaciones y
recursos interactivos de datos.
―En noviembre de 2012 llegamos a los tres años y el año pasado logramos
rentabilidad‖ dijo Rodney Gibbs, jefe de innovación del Texas Tribune. ―Una clave
de nuestra sustentabilidad es la diversidad de nuestras fuentes de ingresos:
socios, eventos, ingresos por ventas, suscripciones corporativas y premios. Dicho
de otro modo, no dependemos de una fuente de ingresos. Más aún, hemos
logrado mantener el gasto dentro de lo presupuestado, al mismo tiempo que crece
nuestro alcance e impacto.‖xci
El Tribune ahora tiene más de 200 herramientas y visualizaciones de datos
diferentes, incluyendo un Explorador de la Educación Púbica y un Explorador de
Educación Superior, que recogen y publican datos financieros, demográficos y
desempeño de cada escuela y college públicos texanos.xcii
Creo que eso nos ayudó a mantenernos ágiles. Si bien nuestro grupo tecnológico
es pequeño -cuatro programadores full-time más un contratado- es suficiente no
solo para sostener nuestro sitio primario, sino también, para las aplicaciones de
datos y visualizaciones que difundimos cada mes. Lo que es más, nuestros dos
periodistas de datos trabajan en toda la redacción en una variedad de temas, por
lo que incluso reporteros que no son locos por los datos pueden obtener datos y
visualizaciones para sus informes. Dicho de otro modo, no hay que convencer a
nadie aquí del valor de los datos, la prueba que aporta el tráfico y la
retroalimentación del público nos convirtió a todos en creyentes.
Pero no se prevé que la tienda sea una fuente de ingresos significativa, por lo
menos de forma inmediata, de acuerdo a Richard Tofel, el presidente de
ProPublica. ―Llevará un tiempo ver si es o no una fuente seria de ingresos‖ me dijo
Tofel.
Hammond cree que a medida que crezca Narrative Science, sus informes irán
ocupando un lugar cada vez más alto en la cadena alimenticia del periodismo:
desde las noticias commodity hasta el periodismo explicativo y, finalmente,
artículos largos y detallados. Quizás en algún punto, los humanos y los algoritmos
colaborarán, cada uno aportando lo mejor de sí. Las computadoras con sus
memorias sin falla y su capacidad para acceder a datos, podrían actuar como los
que se muevan para alimentar a escritores humanos. O vice versa, los reporteros
humanos podrían entrevistar a los sujetos y pescar detalles sueltos y luego
enviarlos a una computadora que los redacta. A medida que las computadoras se
vuelvan más capaces y tengan acceso a cada vez más datos, sus limitaciones
como narradores irán desapareciendo. Puede llevar un tiempo, pero
eventualmente incluso un informe como este podría terminar producido sin mí.
―Los humanos son increíblemente ricos y complejos, pero son máquinas‖ dice
Hammond. ―En 20 años no habrá ningún área en que Narrative Science no escriba
informes‖.
NOTAS
xxxvii
D. Kaplan, ―Global Investigative Journalism: Strategies for Support,‖ Center for
International Media Assistance, National Endowment for Democracy, 13 de en. de
2014, http://cima.ned.org/publications/global-investigative-journalism-strategies-
support (acceso 3 de febrero de 2015).
xxxviii
Committee to Protect Journalists, ―Attacks on the Press,‖ http://cpj.org/attacks/
(acceso 3 de febrero de 2015).
xxxix
Reporters Without Borders, ―World Press Freedom Index de 2014,‖
http://rsf.org/index2014/en-index2014.php (acceso 3 de febrero de 2015).
xl
L. Haddou, ―Press Freedom de 2014: The Global Picture,‖ The Guardian, 1 de
mayo de 2014, http://www.theguardian.com/news/datablog/de 2014/may/01/press-
freedom-de 2014-the-global-picture (acceso 3 de febrero de 2015).
xli
Newsday Media Group LLC, ―An Open-source Django App to Survey
Politicians,‖https://github.com/newsday/newstools-checkup (acceso 3 de febrero
de 2015).
xlii
A. Howard, ―Knight Winners are Putting Data to Work: Open Elections,‖ O‘Reilly
Media, 22 de sep. de 2012, http://strata.oreilly.com/2012/09/knight-news-
challenge-data-winners.html#openelections (acceso 3 de febrero de 2015).
xliii
A. Howard, ―Knight Winners are Putting Data to Work: Census Reporter,‖
O‘Reilly Media, 22 de sep. de 2012, http://strata.oreilly.com/2012/09/knight-news-
challenge-data-winners.html#censusIRE (acceso 3 de febrero de 2015).
xliv
A. Howard, ― NPR News App Team Experiments With Making Data-driven
Public Media With the Public,‖ Tow Center for Digital Journalism, 30 de ag.de
2013, http://towcenter.org/npr-news-app-team-experiments-with-making-data-
driven-public-media-with-the-public/ (acceso 3 de febrero de 2015).
xlv
S. Johnson, ―The Internet? We Built That,‖ New York Times, 21 de sep. de 2012,
http://www.nytimes.com/2012/09/23/magazine/the-internet-we-built-that.html
(acceso 3 de febrero de 2015).
xlvi
S. Johnson, ―Peer Power, from Potholes to Patents,‖ Wall Street Journal,
http://online.wsj.com/news/articles/SB100008723963904441658045780085114937
89642 (acceso 3 de febrero de 2015).
xlvii
A. Howard, ―Knight Winners are Putting Data to Work: Census Reporter,‖ (22 de
sep. de 2012).
xlviii
A. Howard, ―Applying Data Science to All the News That‘s Fit to Print,‖ Tow
Center for Digital Journalism, 7 de abr. de 2014, http://towcenter.org/blog/applying-
data-science-to-all-the-news-thats-fit-to-print/ (acceso 3 de febrero de 2015).
xlix
S. Klein, ―ProPublica News Apps Style Guide,‖ GitHub, 27 de abr. de 2014,
https://github.com/propublica/guides/blob/master/news-apps.md (acceso 3 de
febrero de 2015).
l
H. Vinter, ―Scott Klein: News Apps Don‘t Just Tell a Story, They Tell Your Story,‖
World Association of Newspapers and News Publishers, 24 de ag. de 2011,
http://www.wan-ifra.org/articles/2011/08/24/scott-klein-news-apps-dont-just-tell-a-
story-they-tell-your-story (acceso 3 de febrero de 2015).
li
ProPublica, ―Treatment Tracker,‖ 15 de mayo de 2014,
http://projects.propublica.org/treatment/ (acceso 3 de febrero de 2015).
lii
R.G. Jones and C. Ornstein, ―Top Billing: Meet the Docs who Charge Medicare
Top Dollar for Office Visits,‖ ProPublica, 15 de mayo de 2014,
http://www.propublica.org/article/billing-to-the-max-docs-charge-medicare-top-rate-
for-office-visits (acceso 3 de febrero de 2015).
liii
N. Diakopoulas, ―Algorithmic Accountability Reporting: On the Investigation of
Black Boxes,‖ Tow Center for Digital Journalism, febr. de 2014,
http://towcenter.org/tow-center-publishes-algorithmic-accountability-reporting/
(acceso 3 de febrero de 2015).
liv
C. Wu, ―White House Safety Datapalooza: Bicoastal Safety Data Journalist
Workshop,‖ WhiteHouse.gov, 12 de sep. de 2014,
http://www.whitehouse.gov/photos-and-video/video/2012/09/14/white-house-
safety-datapalooza-bicoastal-safety-data-journalist-wo (acceso 3 de febrero de
2015).
lv
N. Diakopoulas, ―The Rhetoric of Data,‖ Tow Center for Digital Journalism, 25 de
jul. de 2013, http://towcenter.org/blog/the-rhetoric-of-data/ (acceso 3 de febrero de
2015).
lvi
R. Sambrook, ―Journalists Can Learn Lessons From Coders in Developing the
Creative Future,‖ The Guardian, 27 abril de 2014,
http://www.theguardian.com/media/de 2014/apr/27/journalists-coders-
creativefuture (acceso 23 de mayo de 2014).
lvii
B. Keegan, ―The Need for Openness in Data Journalism,‖ briankeegan.com, 7
abril de 2014, http://www.brianckeegan.com/2014/04/the-need-for-openness-in-
data-journalism/ (acceso 3 de febrero de 2015).
lviii
S. Owens, ―A Place for Homicide Watch: Can a Local Blog Fill Some of the
Gaps in Washington, D.C.‘s Crime Coverage?‖ Nieman Journalism Lab, 5 de mayo
de 2011, http://www.niemanlab.org/2011/05/homicide-watch-can-a-local-blog-fill-in-
the-gaps-of-dcs-homicide-coverage/ (acceso 3 de febrero de 2015).
lix
L. Amico, ―Reporting From Analytics: Example,‖ One Reporter's Notebook, 4 de
mayo de 2011, http://lauraamico.tumblr.com/post/5196806316/reporting-from-
analytics-example (acceso 3 de febrero de 2015).
lx
S. Myers, ―Homicide Watch D.C. Uses Clues in Site Search Queries to ID
Homicide Victim,‖ Poynter, 12 de oct. de 2011. http://www.poynter.org/latest-
news/mediawire/149294/homicide-watch-d-c-uses-clues-in-sitesearch-queries-to-
id-homicide-victim/ (acceso 3 de febrero de 2015).
lxi
L. Amico, ―On Deadline: Why Organizing Beats is Just as Important as Large
Investigations,‖ Online News Association, 21 de febr. de 2012,
http://journalists.org/2012/02/21/on-deadline-why-organizing-beats-is-just-as-
important-as-large-investigations/ (acceso 3 de febrero de 2015).
lxii
L. Indvik, ―The Financial Times Has a Secret Weapon: Data,‖ Mashable, 2 abril
2013, http://mashable.com/2013/04/02/financial-times-john-ridding-strategy/
(acceso 3 de febrero de 2015).
lxiii
O. Thomas, ―The Data-Driven Future Of Journalism,‖ ReadWrite, 6 de sep. de
2013, http://readwrite.com/2013/09/06/data-journalism-future (acceso 3 de febrero
de 2015).
lxiv
McKinsey Global Institute, ―The Social Economy: Unlocking Value and
Productivity Through Social Technologies,‖ McKinsey & Company, 2012,
http://www.mckinsey.com/insights/high_tech_telecoms_internet/the_social_econo
my (acceso 3 de febrero de 2015).
lxv
Pew Research Center, ―State of the Media 2013,‖ Pew Project for Excellence in
Journalism, 18 de mayo de 2013, http://stateofthemedia.org/2013/overview-5/
(acceso 3 de febrero de 2015).
lxvi
Ibid.
lxvii
―Paper Cuts,‖ 28 de abr.de 2013, http://newspaperlayoffs.com/ . (acceso 3 de
febrero de 2015)
lxviii
D. Sinker, ―We‘re All Living in an EveryBlock World,‖ dansinker.com, 7 de febr.
de 2013, http://dansinker.com/post/42525273840/were-all-living-in-an-everyblock-
world (acceso 3 de febrero de 2015).
lxix
J. Sonderman, ―NBC Closes Hyperlocal, Data-driven Publishing Pioneer
EveryBlock,‖ Poynter, 2 de febr. de 2013, http://www.poynter.org/latest-news/top-
stories/203437/nbc-closes-hyperlocal-pioneer-everyblock/ (acceso 3 de febrero de
2015).
lxx
R. Graff, ―Journalism‘s Biggest Data Experiment, EveryBlock, Relaunches,‖
Knight Lab, Northwestern University, 31 de en. de 2014,
http://knightlab.northwestern.edu/2014/01/31/journalisms-biggest-data-experiment-
everyblock-relaunches/ (acceso 3 de febrero de 2015).
lxxi
A. Chavez, ―Why Some Hyperlocal Sites Struggle to Attract Audiences,
Generate Revenue,‖ Poynter, 12 de mzo. de 2012. http://www.poynter.org/latest-
news/top-stories/166190/why-some-hyperlocal-sites-struggleto-attract-audiences-
generate-revenue/ (acceso 3 de febrero de 2015).
lxxii
W. Huntsberry, ―Why Hyperlocal Websites Like New Raleigh Can‘t Make Money
Online,‖indyweek.com, 23 de en. de 2013,
http://www.indyweek.com/indyweek/why-hyperlocal-websites-like-newraleigh-cant-
make-money-online/Content?oid=3250659 (acceso3 de febrero de 2015).
lxxiii
H. Ji, M. Jurkowitz, and T. Rosenstiel, ―The Search for a New Business Model,‖
Pew Research Journalism Project, 5 de mzo. de 2012,
http://www.journalism.org/2012/03/05/search-new-business-model/ . (acceso 3 de
febrero de 2015)
lxxiv
L. Kaufman, ―Patch Sites Turn Corner After Sale and Big Cuts,‖ New York
Times, 19 de mayo de 2014,
http://www.nytimes.com/2014/05/19/business/media/patch-sites-turn-corner-after-
sale-and-big-cuts.html (acceso 3 de febrero de 2015).
lxxv
J. Paxton, ―Moving On From Thunderdome,‖ John Paxton, 2 abril de 2014,
http://jxpaton.wordpress.com/2014/04/02/moving-on-from-thunderdome/ (acceso
3 de febrero de 2015).
lxxvi
K. Doctor, ―The Newsonomics of Digital First Media‘s Thunderdome Implosion
(and Coming Sale),‖Nieman Journalism Lab, 2 de abr. de 2014,
http://www.niemanlab.org/2014/04/the-newsonomics-of-digital-first-medias-
thunderdome-implosion-and-coming-sale/ . (Acceso 3 de febrero de 2015)
lxxvii
D. Freid and B. Prieto, ―Firearms in the Family,‖ Digital First Media, 2013,
http://data.digitalfirstmedia.com/guns/ (acceso3 de febrero de 2015).
lxxviii
―Decoding the Kennedy Assassination,‖ Digital First Media, 2013,
http://data.digitalfirstmedia.com/jfk/ (acceso 3 de febrero de 2015).
lxxix
―Bracket Advisor,‖ New Haven Register, de 2014,
http://www.bracketadvisor.com/ (acceso 3 de febrero de 2015).
lxxx
A. Howard, ―Publishers Can Afford Data Journalism Says ProPublica‘s Scott
Klein,‖ 23 de abr. de 2014, http://towcenter.org/publishers-can-afford-data-
journalism-says-propublicas-scott-klein/ (acceso 3 de febrero de 2015).
lxxxi
R. Yu, ―Booming Market for Data-driven Journalism,‖ USA Today, 17 de mzo.
de 2014, http://www.usatoday.com/story/money/business/2014/03/16/data-
journalism-on-the-rise/6424671/ (acceso 3 de febrero de 2015).
lxxxii
Pew Research Center, ―The Growth of Digital Reporting,‖ Pew Research
Journalism Project, 26 de mzo. de 2014, http://www.journalism.org/2014/03/26/the-
growth-in-digital-reporting/ (acceso 3 de febrero de 2015).
lxxxiii
Pew Research Center, ―State of the Media de 2014,‖ (26 de mayo de 2014).
lxxxiv
L. Moses, ―Is There an Ad Model for Explainer Journalism?‖ Digiday, 22 de
abr. de 2014, http://digiday.com/publishers/ad-model-explainer-journalism/ (acceso
3 de febrero de 2015).
lxxxv
L. Bounegru, L. Chambers, and J. Gray, eds., 2012.
lxxxvi
B. Mullens and C. Weaver, ―Open-Government Laws Fuel Hedge-Fund
Profits,‖ Wall Street Journal, 23 de sep 2013,
http://online.wsj.com/news/articles/SB100014241278873242023045790530334441
12314 (acceso 3 de febrero de 2015).
lxxxvii
A. Howard, ―As Digital Disruption Comes to Africa, Investing in Data
Journalism Takes on New Importance,‖ Radar, O'Reilly Media, 29 de nov. de 2012,
http://radar.oreilly.com/2012/11/justin-arenstein-africa-data-journalism.html (acceso
3 de febrero de 2015).
lxxxviii
S. Myers, ―New York Times News Apps Team Ventures into Product
Development with Olympics Syndication,‖ Poynter, 8 de ag. de 2012,
http://www.poynter.org/latest-news/top-stories/184315/new-yorktimes-news-apps-
team-ventures-into-product-development-with-olympics-syndication/ (acceso 3 de
febrero de 2015).
lxxxix
Associated Press, ―AP Products and Services: New Media,‖
http://www.ap.org/products-services/new-media (acceso 3 de febrero de 2015).
xc
J. Maher, ―London Calling: Winning the Data Olympics,‖ Source, OpenNews, 25
de abr.de 2013, https://source.opennews.org/en-US/learning/london-calling-
winning-data-olympics/ (acceso 3 de febrero de 2015).
xci
E. Smith, ―T-Squared: Three More Years!‖ Texas Tribune, 5 de nov. de 2012.
http://www.texastribune.org/2012/11/05/t-squared-three-more-years/ (acceso 3 de
febrero de 2015).
xcii
―The Texas Tribune Higher Education Explorer,‖ Texas Tribune,
http://www.texastribune.org/higher-ed/explore/ (acceso 3 de febrero de 2015).
xciii
―Data Pages | The Texas Tribune,‖ Texas Tribune,
http://www.texastribune.org/library/data/ (acceso 3 de febrero de 2015).
xciv
―Elected Officials Directory | The Texas Tribune,‖ Texas Tribune,
http://www.texastribune.org/directory/ (acceso 23 de mayo de 2014).
xcv
E. Smith, ―T-Squared: It‘s Only Bidness,‖ Texas Tribune, 14 de en. de 2013,
http://www.texastribune.org/2013/01/14/t-squared-it-was-only-bidness/ (acceso 3
de febrero de 2015).
xcvi
―Texas Prison Inmates,‖ Texas Tribune,
http://www.texastribune.org/library/data/texas-prisons/ (acceso 3 de febrero de
2015).
xcvii
―Government Employee Salaries,‖ Texas Tribune,
http://salaries.texastribune.org/ (acceso 3 de febrero de 2015).
xcviii
―Texas Gubernatorial Election Results Maps,‖ Texas Tribune, 7 de nov. de
2010, http://www.texastribune.org/library/data/texas-governors-race-results-maps/
(acceso 3 de febrero de 2015).
xcix
S. Klein, ―Introducing the ProPublica Data Store,‖ ProPublica, 26 de febr. de
2014, http://www.propublica.org/article/introducing-the-propublica-data-store
(acceso 3 de febrero de 2015).
c
J. Ellis, ―ProPublica Opens Up Shop with a New Site to Sell Custom Datasets,‖
Nieman Journalism Lab, 4 de mzo. de 2014,
http://www.niemanlab.org/2014/03/propublica-opens-up-shop-with-a-new-site-to-
sell-custom-datasets/ (acceso 3 de febrero de 2015).
ci
ProPublica, ―Dollars for Docs,‖ https://projects.propublica.org/docdollars/
(acceso3 de febrero de 2015).
cii
S. Klein and R. Tofel, ―ProPublica: Why we Use Creative Commons Licenses on
our Stories,‖ Nieman Journalism Lab, 13 de dic.de 2012.
http://www.niemanlab.org/2012/12/propublica-why-we-use-creative-commons-
licenses-on-our-stories/ (acceso 3 de febrero de 2015).
ciii
T. Ali, ―ProPublica Plans to Grow its ‗Data Store,‘ ‖ Columbia Journalism Review,
28 de abr. de 2014,
http://www.cjr.org/behind_the_news/propublica_plans_to_grow_its_d.php (acceso
3 de febrero de 2015).
civ
J. Webb, ―Transforming Data into Narrative Content,‖ O'Reilly Media, 26 de en.
de 2012, http://toc.oreilly.com/2012/01/narrative-science-kristian-hammond-data-
content-generation.html (acceso3 de febrero de 2015).
cv
W. Oremus, ―The First News Report on the L.A. Earthquake Was Written by a
Robot,‖ Slate, 17 de mzo. de 2014,
http://www.slate.com/blogs/future_tense/2014/03/17/quakebot_los_angeles_times_
robot_journalist_writes_article_on_la_earthquake.html (acceso 3 de febrero de
2015).
cvi
―The Homicide Report,‖ Los Angeles Times, mayo de 2014,
http://homicide.latimes.com/ (acceso 3 de febrero de 2015).
cvii
A. Webb, ―The Future of News is Anticipation,‖ Nieman Journalism Lab, dic.de
2013, http://www.niemanlab.org/2013/12/the-future-of-news-is-anticipation/
(acceso 3 de febrero de 2015).
cviii
―Curbwise,‖ Omaha World-Herald, http://www.curbwise.com/ (acceso 23 de
mayo de 2014).
IV. Ejemplos Notables
―El proyecto del que estoy más orgulloso es el que hice antes de SOAP Opera,
que fue nuestro proyecto de 2010 'Dollars for Docs‘‖ (Dólares para médicos) dijo
Dan Nguyen, entonces programador en ProPublica. ―Comenzó con solo un
comentario que escribí en un blog para mostrar a otros periodistas la utilidad del
scraping en la red.cxxii En este caso extraje datos de un sitio que Pfizer usaba para
dar a conocer lo que pagaba a médicos que hacen trabajos de promoción y
consultoría. Mis colegas le prestaron atención y dijeron que podíamos hacer lo
mismo en todas las compañías que dieran a conocer sus pagos. Debido a que
cada firma daba a conocer estos pagos en una variedad de formatos, incluyendo
contenedores Flash y PDF, poca gente había tratado de analizar estos informes
de conjunto para ver las tendencias nacionales en estas relaciones financieras‖.
Nguyen explicó que el equipo de ProPublica hizo docenas de programas para
extraer datos que permitieron hacer referencias cruzadas de las bases datos de
pagos con listados de las direcciones médicas estaduales y distintas facultades de
medicina. ―Para el informe inicial hicimos equipo con otras cinco redacciones,
incluyendo NPR y el Boston Globe, lo que requirió programáticamente crear un
sistema en el que pudiéramos coordinar datos e investigaciones‖, dijo. ―Por la gran
cantidad de datos que obteníamos y la cantidad de reporteros y editores
trabajando en esto por fuera de nuestras oficinas, este no podía ser un proyecto
exitoso solo con intercambiar archivos Excel‖.cxxiii
El proyecto ―Dollars for Docs‖ muestra cómo el periodismo basado en datos puede
derivar en un impacto sobre pacientes, proveedores, compañías privadas y
universidades; en síntesis, todo el sector de la salud.
―El sitio que construimos basado en esos datos es el más visitado de todos
nuestros proyectos, ya que fueron millones las personas que lo usaron para
buscar sus médicos‖ dijo Nguyen. ―Luego compartimos nuestros datos con
cualquier fuente informativa que los pidiera, por lo que cientos de informes
independientes, también se basaron en nuestros datos. Entre los resultados
obtenidos contamos con el que se dio en las compañías farmacéuticas y las
facultades de medicina quienes reanalizaron sus políticas para tales iniciativas y
para los conflictos de intereses.‖
En 2013, la emisora de radio pública de la ciudad de New York pidió a los oyentes
que ayudaran a rastrear la aparición de cigarras con sensores de bajo costo. El
proyecto ―Cicada Tracker‖ (Rastreador de Cigarras) registró alrededor de 8000
vistas de cigarras con 800 personas fabricando sus propios rastreadores.cxxiii El
proyecto hizo realidad -y no meramente una teoría- la recolección de datos por el
públicocxxix por medio de periodismo de sensorescxxx y una audiencia diseminada,
lo que resultó en 15.000 lecturas de temperatura. Las lecciones del proyecto del
rastreador de cigarras debiera orientar los futuros esfuerzos de los medios
públicos para promover la participación de la práctica de ciencia y recolección de
datos directa por parte de los ciudadanos. Para una observación más profunda en
el tema, vea las actas del taller de periodismo de sensores del Tow Center del año
pasado.cxxxi
A fines de 2013, el equipo de Visuales de NPR difundió un proyecto en torno de
plazas con juegos accesibles. NPR hizo un pedido a su comunidad de audiencia y
lectores: Ayuden a los medios púbicos a recolectar datos y hagan que el recurso
sea mejor para todos. La aplicación de plazas con juegos NPR permite a padres y
niños buscar plazas accesibles, utilizando los motores de búsqueda comúnmente
usados por los consumidores y combinándolos con un importante elemento de
servicio público.cxxxii
―Esto es parecido a Yelp, salvo que es para plazas, con juegos para chicos con
necesidades especiales‖ dijo Brian Boyer, jefe del equipo de Visuales de NPR en
una entrevista. ―Es la primera en su tipo, una base de datos nacional de plazas
con juegos que se adaptan a chicos en silla de ruedas, chicos con autismo o
chicos con otras necesidades especiales.‖
NPR incentivó a su púbico para que sean activos participantes en la recolección
de datos, del mismo modo que la ―Cuenta de Pájaros de Navidad‖ de Audubon‖ y
eBird recurren al público para recoger datos acerca de especies de pájaros.cxxxiii
En las primeras 48 horas, luego del lanzamiento de la aplicación, se agregaron a
la base de datos 336 plazas, dentro de un total de 1293. En mayo de 2014, la
aplicación de las plazas, tenía 19.078 entradas y seguía creciendo.
La aplicación es un caso notable de estudio respecto de la incorporación del
público y la creación de datos a través de las multitudes. Hay décadas de
antecedentes de públicos que colaboran con una organización de medios en la
recolección de imágenes, vídeos o informes.
Lo que sigue siendo relativamente nuevo es la capacidad de una multitud en red
de aportar datos, vengan de sensores en sequíascxxxiv o contadores geigercxxxv
cercanos a fuentes potenciales de radicación. Si convertir datos en informes es
actualmente un elemento central en el periodismo de investigación, los equipos de
visuales de WNYC y NPR han mostrado la mejor forma de hacerlo, y servir al
público en ese camino. cxxxvi
d. Servicio Público
El Datablog y sus editores establecieron una norma importante que muchos otros
periodistas de datos siguen abrazando: muestre su trabajo y comparta sus datos.
Yo hice un perfil del trabajo de periodismo de datos del Los Angeles Times a
comienzos de 2013, cuando entrevisté al programador de noticias Ben Welsh
acerca del DataDesk del diario.cli El equipo relativamente pequeño de reporteros y
programadores de la red se especializa en mapas, bases de datos, análisis y
visualizaciones. Por ejemplo, una visualización interactiva presentaba el mapa de
la velocidad de respuesta del departamento de bomberos de Los Ángeles a las
llamadas recibidas.clii La visualización fue parte de una serie más larga sobre la
distribución de las llamadas al 911 en el distrito de LA, cliii que combinó el
periodismo de investigación con análisis de datos para crear narrativas
importantes y llamativas que obligaron al gobierno a rendir cuentas y demostraron
que existen problemas significativos en la recolección de datos que hace la
ciudad.
La investigación ofreció una visión que no pierde actualidad y que perdurará más
allá de la ―era de los grandes datos‖: las malas prácticas de recolección de datos y
una TI (Tecnología Informática) envejecida descarrilará todos los esfuerzos
institucionales por usar el análisis de datos para mejorar el desempeño.
El Los Angeles Times descubrió que el mal registro de los datos está trabando los
esfuerzos del gobierno estadual por mejorar el sistema del 911 de California. Tal
como sucede con cualquier proyecto de bases de datos, hay que rechazar el
sistema de ―basura que entra, basura que sale‖ (en inglés se lo conoce como
―garbage in, garbage out‖ o ―GIGO‖.)
Como informaron Ben Welsh y Robert J. López del L.A. Times en diciembre de
2012, la Autoridad de Servicios Médicos de Emergencia de California ha estado
trabajando para centralizar datos de desempeño desde 2009. Desgraciadamente,
es difícil lograr mejoras basadas en datos o subrayar problemas percibidos en los
grandes conjuntos de información del área pública, si la recolección misma de
datos tiene fallas.cliv El L.A. Times informó de problemas de calidad derivados
tanto de cómo se mide los tiempos de respuesta, cómo se hace el registro de
datos en papel, y hasta casos en que directamente no se guardó registro.
Cuando hice el análisis del trabajo de Ben Welsh en 2012, me dijo que este
proyecto es exactamente el tipo de trabajo del que está más orgulloso. ―Como
sabemos hay muchos datos por ahí‖ dijo Welsh. ―Y como lo sabe cualquiera que
trabaja con esos datos, la mayor parte es basura. Los proyectos de los que estoy
más orgulloso han tomado grandes conjuntos de datos sucios y los han refinados
hasta convertirlos en algo que vale la pena saber: un gráfico sintético en una
historia de investigación o una aplicación basada en datos que da al lector alguna
visión nueva del mundo que lo rodea.‖clv
Más al norte, en California, un nuevo experimento está aplicando el periodismo de
datos a la transparencia del gobierno municipal en Oakland, es un sitio llamado
Oakland Police Beat que empezó a funcionar en la primavera boreal de 2014.clvi
Es sitio un espacio sin fines de lucro, que es parte de Oakland Local y el Center
for Media Change (Centro para Cambios en los Medios) -y con financiación de
Ethics and Excellence in Journalism Foundation (Fundación de Ética y excelencia
en el Periodismo) y el Fund for Investigative Journalism (Fondo para el Periodismo
de Investigación)- fue fundado conjuntamente por Susan Mernit y Abraham Hyatt,
ex editor ejecutivo de ReadWrite. (Para que se sepa. Haytt editó lo que publiqué
allí.)
Oakland Police Beat está dedicado directamente a echar luz sobre las prácticas de
los agentes de la ley de Oakland. Su primer informe no se anduvo con vueltas,
descubriendo que los agentes más condecorados de Oakland eran objeto de
cantidades de demandas por brutalidad y responsables de numerosos tiroteos.
El sitio demostró dos prácticas importantes que merecen convertirse en la norma
del periodismo de datos: explicar la metodología que sostiene su análisis,
incluyendo las notas de fuentes, y la publicación (eventualmente) de los datos
detrás de la investigación.
ProPublica lo hace, el Datablog lo hace y también el Los Angeles Times. El Data
Desk del Times estableció un estándar más elevado en su investigación del
tiempo de respuesta de las ambulancias, no sólo encontrándole sentido a los
datos, sino también publicando los datos que son la base para los mapas de
código abierto de los entes de emergencias médicas de California, como parte de
una serie sobre el dominio público.clvii
Esta no fue la primera vez que el equipo puso a disposición del público su código,
ni sería la última (Basta visitar la cuenta Github del Data Desk para tener pruebas
de ello.)clviii Como señaló Welsh en un comentario online sobre la serie,clix el Data
Desk ha ―comunicado previamente sobre los métodos técnicosclx usados para
realizar [la] investigación, difundió la capa de base creada para un mapa
interactivo de tiempos de respuesta,clxi y contribuido con la ubicación de las 106
estaciones del departamento de bomberos de Los Ángeles (LAFD) en el Mapa de
Calles Abierto.clxii
Scott Klein ofreció el siguiente comentario:
Si se hace bien, la gente tiene realmente mucho apetito por ver los datos. Es
suficiente ver cuanta gente entiende -y le encantan- estadísticas deportivas
increíblemente sofisticadas e impenetrables. Debiéramos poder confiar en
que nuestros lectores comprenderán datos en otros contextos también. Si
hacemos un buen trabajo, la mayoría de la gente debería poder entrar a
nuestra aplicación noticiosa Prescriber Checkup (Control de Recetadores),clxiii
buscar sus médicos, y comparar su patrón de recetas con el de sus pares,
además de entender lo que está en juego y qué hacer con la información que
encuentra.
Como subrayó David Kaplan, director del Global Investigative Journalism Network
(Red de Periodismo de Investigación Global), las grandes bases de datos, el
análisis de las redes y el código no reemplazan el periodismo de investigación. clxxv
Estas tecnologías aumentan y extienden las posibilidades de las organizaciones
de medios, investigadores solitarios o incluso equipos de periodistas trabajando en
cooperación a través de fronteras y zonas horarias. Este tipo de colaboración pasó
de ser algo potencial a convertirse en realidad en los últimos tres años, cuando un
equipo de más de 80 periodistas de 40 países diferentes trabajaron juntos para
crear un mapa mundial de trusts secretos y compañías offshore.
El International Consortium of Investigative Journalists (Consorcio Internacional de
Periodistas de Investigación) analizó 260 gigabytes de datos corporativos
trascendidos en la forma de texto, PDF, imágenes y hojas de cálculo para revelar
cómo funcionarios estatales estaban sacando dinero de sus países, cómo estaban
involucrados distintos bancos en esta práctica, y cómo usa las mismas estructuras
el crimen organizado.clxxxvi ―Offshore Leaks‖ es un triunfo para el periodismo de
datos.clxxvii Es probable que este modelo se refine y sea aplicado nuevamente en el
futuro.
El proyecto ―representa un nuevo enfoque para Reuters News‖, escribió Liu. ―Es
un modelo, utilizar lo que informamos todos los días respecto de personas,
instituciones, el poder y las relaciones y ponerlo en un formato que le da
significado sostenido en el tiempo‖. Y agregó:
Pocos meses antes de que Connected China estuviera disponible, Miguel Paz y
sus colegas lanzaron un enfoque basado en datos similar para hacer el
seguimiento de la elite de Chile.clxxx En 2011, cuando Paz aún era el editor
ejecutivo de El Mostrador, ganó un Knight News Challenge (Desafío Noticioso
Knight) para crear una plataforma interactiva que siguiera las relaciones dentro de
una base de datos de entidades armada a partir de investigaciones y
crowdsourcing.clxxxi
En diciembre de 2012, la versión beta del sitio entró en actividad y luego creció
con el apoyo de Startup Chile y el International Center for Journalists (ICFJ, Centro
Internacional para Periodistas). En los meses transcurridos desde entonces,
Poderopedia (el nombre de la plataforma) ha madurado y crecido más allá de
Chile dando las bases para una plataforma de votación en Panamá.clxxxii
―Gabriel García Márquez ha dicho que hablar de 'periodismo de investigación' es
redundante, porque supone que cualquier forma de periodismo debiera ser de
investigación‖ dijo Paz en una entrevista. ―El propósito del periodismo es mostrar
lo que los poderosos quieren ocultar. Esto vale para cualquier forma de
periodismo.‖
En 2014 la Fundación Poderopedia anunció planes para expandirse a Venezuela y
Colombia.clxxxiii
cxciv
Amigos y hasta un peluquero en el llamativo reparto de la publicidad oficial.
http://blogs.lanacion.com.ar/projects/data/1146/
Ley de Medios: El 94% de los medios creados con la nueva ley es estatal.cxcvi
http://blogs.lanacion.com.ar/projects/data/ley-de-medios-el-94-de-los-medios-
creados-con-la-nueva-ley-es-estatal/
http://blogs.lanacion.com.ar/projects/data/gastos-del-senado/
Guido Romero, editor de ciencias de Wired Italy que publicó el trabajo, compartió
algo más acerca de la historia detrás del proyecto por correo electrónico.
―En Italia hay unos 50.000 edificios escolares‖, dijo Romero. ―Protezione Civile, la
agencia federal de manejo de emergencia italiana, estima que 22.500 de ellas
deben ser chequeadas para verificar su seguridad sísmica. La población escolar
total italiana es de ocho millones (estudiantes + docentes + personal), por lo que
usted puede ver lo relevante de este problema.‖
La historia detrás del proyecto de Wired Italy subrayó un desafío en Italia que
existe en muchos otros lugares del mundo: cómo puede practicarse el periodismo
de datos en países que no tienen una ley de Acceso a la Información Pública o
una tradición de transparencia respecto de las acciones y el gasto público.
El gobierno italiano, que viene muy a la zaga del Reino Unido, ha puesto más
datos abiertos a disposicióncciv desde que lanzó una plataforma nacional en
2011.ccv En este caso, sin embargo, los únicos datos que el Ministerio de
Educación Italiano difundió fue una lista de edificios escolares publicado online.
Como dije antes, Tola y su equipo sumaron o crearon el resto de los datos usados
en el proyecto, por medio de extracción y procesado de PDF de datos de gasto de
sitios en la red de gobiernos regionales, y luego, agregaron la geo-localización en
cooperación con un programador local.
Los medios en todo África enfrentan estos desafíos y aún más, batallando con
funcionarios públicos obstinados, registros en papel, inexistencia de leyes de
información y amenazas abiertas y violencia física contra periodistas. Ahora
adquiere nuevo relieve el desarrollo de la capacidad de los medios africanos de
practicar el periodismo basado en datos, al introducirse en los países del
continente la conmoción digital que ha alterado permanentemente los modelos de
países más desarrollados.ccvii Son significativos los desafíos que el periodismo de
datos enfrenta en África Occidental, aunque no son distintos de los que se ven en
otras partes del continente.ccviii
Justin Arenstein, un periodista de investigación sudafricano, es decidido partidario
del periodismo basado en datos que no sólo le encuentra un sentido al mundo a
los lectores y espectadores, sino que también les aporta herramientas para
involucrarse más en el cambio de las condiciones que conocen a través de ese
trabajo. Por ejemplo, el periodismo de datos dio impulso al registro de votantes en
Kenia,ccix creando un sitio simple que usa herramientas y tecnologías modernas
con base en la red.
Un ―encuentro de datos‖ en Kenia en 2012 condujo a otro excelente ejemplo de
esta dinámica. Arenstein explicó:
NTV, el canal nacional de aire gratuito, había estado estudiando por qué
chicas jóvenes en una zona rural de Kenia rendían muy bien
académicamente hasta la edad de 11 o 12 años y luego desparecían por
completo del registro académico o su desempeño caía a pique. La
explicación de las autoridades se basaba en que esto es simplemente algo
tradicional; es tribal. Las familias las sacan de la escuela para hacer tareas y
ocuparse de la casa y, como resultado de ello, no pueden rendir en la
escuela.
Resultó que esta era una conclusión incorrecta. Irene Choge, una periodista
keniata que participó de la capacitación en periodismo de datos, comenzó a
recuperar los datos disponibles y los registros públicos. Choge primero analizó los
registros médicos para ver si tenía incidencia el cólera. Luego examinó los
registros de agua e infraestructura física. Fue allí donde encontró una correlación
clave: las escuelas que mostraban las peores caídas en el desempeño académico
de niñas adolescentes eran las que no tenían instalaciones sanitarias.
Choge subsecuentemente trabajó con programadores para crear una aplicación
simple basada en mensajes SMS que permite a los padres determinar la
comparación entre escuelas y, reclamar cambios. Su trabajo informando de
problemas sanitarios en escuelas ha llevado a funcionarios a reorientar recursos
hacia la construcción de instalaciones sanitarias.ccx
Aunque tales aplicaciones se adentran en los dominios de los reclamos políticos y
la participación ciudadana que pueden resultar incómodos para muchos
periodistas, el crecimiento de servicios que abarcan la intersección entre el
gobierno abierto y el periodismo de datos continuará siendo un terreno importante
y fértil en los próximos años.
NOTAS
cix
A. Howard, ―Open Government Data Shines a Light on Hospital Billing and
Health Care Costs,‖ E Pluribus Unum., 8 de mayo de 2013, http://e-
pluribusunum.com/2013/05/08/open-government-data-hospital-billing-healthcare-
cost/ (acceso 3 de febrero de 2015).
cx
A. Howard, ―Medicare Release and DATA Act Signal Major Events in the Age of
Data Transparency,‖TechRepublic, 15 de abr. de 2014,
http://www.techrepublic.com/article/medicare-release-and-data-act-signal-major-
events-in-the-age-of-data-transparency/ (acceso 3 de febrero de 2015).
cxi
P. Reese and D. Smith, ―Million-dollar Hospital Bills Rise Sharply in Northern
California,‖ The Sacramento Bee, 11 de mzo. de 2012,
http://www.sacbee.com/2012/03/11/4328036/million-dollar-hospital-bills.html
(acceso 3 de febrero de 2015).
cxii
―Patient Safety,‖ The Dallas Morning News Investigations and Special Reports,
2012, http://www.dallasnews.com/investigations/patient-safety/ (acceso 23 de
mayo de 2014).
cxiii
L. Girion, S. Glover, and D. Smith, ―Drugs Deaths Now Outnumber Traffic
Fatalities in U.S., Data Show,‖ Los Angeles Times, 17 de sep. de 2011,
http://articles.latimes.com/2011/sep/17/local/la-me-drugs-epidemic-20110918
(acceso 3 de febrero de 2015)
cxiv
B. Sanderlin, ―Fake Medical Providers Slip Through Medicare Loophole,‖
Atlanta Journal-Constitution, 2 de dic.de 2012,
http://www.ajc.com/news/news/fake-medical-providers-slip-through-medicare-
looph/nTLFF/ (acceso 3 de febrero de 2015).
cxv
―Medical Helicopter Flights Mostly for Routine Transport, Argus Leader, via IRE,
http://www.ire.org/blog/extra-extra/2012/12/03/hospital-helicopters-worth-cost/
(acceso 3 de febrero de 2015).
cxvi
―Election Results,‖ New York Times, 2012,
http://elections.nytimes.com/2012/results/president (acceso 3 de febrero de 2015).
cxvii
―Toxic Waters,‖ New York Times, 2009–2010, http://projects.nytimes.com/toxic-
waters (acceso 3 de febrero de 2015).
cxviii
―U.S. Congressional Votes Database,‖ Washington Post, 2005,
http://projects.washingtonpost.com/congress/113/ (acceso 3 de febrero de 2015).
cxix
―Philip Meyer Journalism Awards,‖ Investigative Reporters and Editors,
http://www.ire.org/awards/philip-meyer-awards/ (acceso 3 de febrero de 2015).
cxx
―Data Journalism Awards de 2014,‖ Global Editors Network,
http://www.globaleditorsnetwork.org/programmes/data-journalism-awards/ (acceso
3 de febrero de 2015).
cxxi
―The Prescribers,‖ ProPublica, 2013–de 2014,
http://www.propublica.org/series/prescribers (acceso 3 de febrero de 2015).
cxxii
―Dollars for Docs,‖ ProPublica, http://projects.propublica.org/docdollars/
(acceso 3 de febrero de 2015).
cxxiii
D. Nguyen, ―Scraping for Journalism: A Guide for Collecting Data,‖ ProPublica,
30 dic de. 2010, http://www.propublica.org/nerds/item/doc-dollars-guides-
collecting-the-data (acceso 3 de febrero de 2015).
cxxiv
J. Merrill, A. Shaw, and A. Zamora, ―Free the Files,‖ ProPublica, 21 de mayo de
2014, https://projects.propublica.org/free-the-files/ (acceso 3 de febrero de 2015).
cxxv
J. Elliot, ―Political Ad Data Comes Online — But It‘s Not Searchable,‖
ProPublica, 2 de ag.de 2012, http://www.propublica.org/article/political-ad-data-
comes-online-but-its-not-searchable (acceso 3 de febrero de 2015).
cxxvi
A. Shaw, ―Transcribable: Free the Files to Go!‖ ProPublica, 16 de jul.de 2013,
http://www.propublica.org/nerds/item/transcribable-free-the-files-to-go (acceso 3
de febrero de 2015).
cxxvii
A. Zamora, ―Crowdsourcing Campaign Spending: What We Learned From
Free the Files, ‖ProPublica, 12 de dic.de 2012,
http://www.propublica.org/article/crowdsourcing-campaign-spending-what-we-
learned-from-free-the-files (acceso 3 de febrero de 2015).
cxxviii
―Cicada Tracker,‖ WNYC, http://project.wnyc.org/cicadas/ , mayo de 2013,
(acceso 3 de febrero de 2015).
cxxix
C. Donovan, ―The Cicadas Are Here: 4 Lessons From WNYC‘s Cicada Tracker
Project,‖ Nieman Journalism Lab, 3 de junio de 2013,
http://www.niemanlab.org/2013/06/the-cicadas-are-here-4-lessons-from-wnycs-
cicada-tracker-project/ (acceso 3 de febrero de 2015).
cxxx
A. Howard, ―Sensoring the News,‖ Radar, O'Reilly Media, 22 de mzo. de 2013,
http://radar.oreilly.com/2013/03/sensor-journalism-data-journalism.html (acceso 3
de febrero de 2015).
cxxxi
Tow Center for Digital Journalism, Columbia University, Sensor Journalism
Workshop, junio 1-2, 2013, http://towcenter.org/research/sensor-journalism-at-the-
tow-center/sensor-journalism-workshop-at-the-tow-center/ (acceso 23 de mayo de
2014).
cxxxii
―Playgrounds for Everyone,‖ NPR, http://apps.npr.org/playgrounds/ (acceso 3
de febrero de 2015).
cxxxiii
J. Robbins, ―Crowdsourcing, for the Birds,‖ New York Times, 19 de ag. de
2013, http://www.nytimes.com/2013/08/20/science/earth/crowdsourcing-for-the-
birds.html?pagewanted=all (acceso 3 de febrero de 2015).
cxxxiv
M. Waite, ―Slouching Toward Sensor Journalism,‖ Source, OpenNews, 11
junio de 2013, https://source.opennews.org/en-US/articles/slouching-toward-
sensor-journalism/ (acceso 3 de febrero de 2015).
cxxxv
E. Zuckerman, ―Citizen Science Versus NIMBY?‖ ―My Heart's in Accra,‖ 29 de
ag. de 2013, http://www.ethanzuckerman.com/blog/2013/08/29/citizen-science-
versus-nimby/ (acceso 3 de febrero de 2015).
cxxxvi
A. Miars, ―NPR‘s Apps Editor Brian Boyer Turns Data into Stories,‖ It‘s All
Journalism, 6 de jul. de 2013, http://itsalljournalism.com/nprs-apps-editor-brian-
boyer-turns-data-into-stories/ (acceso 3 de febrero de 2015).
cxxxvii
The Guardian Datablog, http://www.theguardian.com/news/datablog (acceso
3 de febrero de 2015).
cxxxviii
J. Burn-Murdoch, ―Mapping Racist Tweets in Response to President Obama‘s
re-election,‖The Guardian Datablog, 9 de nov. de 2012,
http://www.theguardian.com/news/datablog/2012/nov/09/mapping-racist-tweets-
president-obama-reelection (acceso 3 de febrero de 2015).
cxxxix
S. Rogers, ―Government Spending by Department, 2011–12,‖ The Guardian
Datablog, 4 de dic.de 2012,
http://www.theguardian.com/news/datablog/2012/dec/04/government-spending-
department-2011-12 (acceso 3 de febrero de 2015).
cxl
S. Rogers, ―Named and Shamed: The Worst Government Annual Reports,
2012,‖ The Guardian Datablog, 4 de dic.de 2012,
http://www.theguardian.com/news/datablog/2012/dec/04/departmental-reports-
worst-named-shamed (acceso 3 de febrero de 2015).
cxli
S. Rogers, ―Gun Crime Statistics by U.S. State: Latest Data,‖ The Guardian
Datablog, 10 de en. de 2011,
http://www.theguardian.com/news/datablog/2011/jan/10/gun-crime-us-state
(acceso 3 de febrero de 2015).
cxlii
S. Rogers, ―The Gun Ownership and Gun Homicides Murder Map of the World,‖
The Guardian Datablog, 22 de jul. de 2012,
http://www.theguardian.com/news/datablog/interactive/2012/jul/22/gun-ownership-
homicides-map (acceso 3 de febrero de 2015).
cxliii
A. Howard, ―UK Cabinet Office Relaunches Data.gov.uk, Releases Open Data
White Paper,‖ Radar, O'Reilly Media, 29 junio de 2012,
http://strata.oreilly.com/2012/06/uk-cabinet-office-relaunches-d.html (acceso 3 de
febrero de 2015).
cxliv
A. Howard, ―Open Data 500: Proof That Open Data Fuels Economic Activity,‖
TechRepublic, 8 de abr. de 2014, http://www.techrepublic.com/article/open-data-
500-proof-that-open-data-fuels-economic-activity/ (acceso 3 de febrero de 2015).
cxlv
A. Howard, ―Finding and Telling Data-driven Stories in Billions of Tweets,‖
Radar, O'Reilly Media, 18 de abr.de 2013, http://strata.oreilly.com/2013/04/finding-
and-telling-data-driven-stories-in-billions-of-tweets.html (acceso 3 de febrero de
2015).
cxlvi
S. Rogers, ―Simon Rogers on Data Journalism in the Open,‖ Tow Center for
Digital Journalism, 25 de mzo. de 2014,
http://digiphile.tumblr.com/post/80800219507/simon-rogers-on-data-journalism-in-
the-open (acceso 3 de febrero de 2015).
cxlvii
J. Cheshire, Spatial.ly, http://spatialanalysis.co.uk/ (acceso 3 de febrero de
2015).
cxlviii
Oxford Internet Institute, http://www.floatingsheep.org/ (acceso 3 de febrero de
2015).
cxlix
―Data Desk,‖ Shaw Media, http://globalnews.ca/data-desk/ (acceso 3 de
febrero de 2015).
cl
―On Oklahoma Tornado Damage,‖ NPR, http://apps.npr.org/moore-oklahoma-
tornado-damage/ (acceso 3 de febrero de 2015).
cli
A. Howard, ―Profile of the Data Journalist: The Human Algorithm,‖ Radar, O'Reilly
Media, 2 de mzo. de 2013, http://strata.oreilly.com/2012/03/profile-of-the-data-
journalist-2.html (acceso 3 de febrero de 2015).
clii
―Map: How Fast is LAFD Where you Live?" Los Angeles Times,
http://graphics.latimes.com/how-fast-is-lafd (acceso 3 de febrero de 2015).
cliii
―911 Breakdowns at LAFD,‖ Los Angeles Times, 2012,
http://www.latimes.com/local/lafddata/ (acceso 3 de febrero de 2015).
cliv
R. Lopez and B. Welsh, ―Flawed Data Stall California‘s 911 Upgrades,‖ Los
Angeles Times, 21 de dic.de 2012, http://articles.latimes.com/2012/dec/21/local/la-
me-ems-data-problems-20121222 (acceso 3 de febrero de 2015).
clv
A. Howard, ―Profile of the Data Journalist: The Human Algorithm,‖ 2 de mzo. de
2013.
clvi
Oakland Police Beat, de 2014, http://oaklandpolicebeat.com/ (acceso 3 de
febrero de 2015).
clvii
―Open-source Maps of California‘s Emergency Medical Agencies,‖ Los Angeles
Times, dic.de 2012, http://datadesk.latimes.com/posts/2012/12/map-of-california-
ems-agencies/ (acceso 3 de febrero de 2015).
clviii
Los Angeles Times Data Desk, GitHub, https://github.com/datadesk (acceso 3
de febrero de 2015).
clix
B. Welsh, ―Inside Our 911 Response Time Analysis,‖ Los Angeles Times, 20 de
oct. de 2012, http://datadesk.latimes.com/posts/2012/10/lafd-border-analysis/
(acceso 3 de febrero de 2015).
clx
B. Welsh, ―Introducing Quiet L.A.,‖ Los Angeles Times, 14 de nov. de 2012,
http://datadesk.latimes.com/posts/2012/11/introducing-quiet-la/ (acceso 3 de
febrero de 2015).
clxi
―Map: How Fast is LAFD Where you Live?" Los Angeles Times,
http://graphics.latimes.com/how-fast-is-lafd (acceso 3 de febrero de 2015).
clxii
B. Welsh, ―The Times Contributes LAFD Fire Stations to OpenStreetMap,‖ Los
Angeles Times, 6 de dic.de 2012, http://datadesk.latimes.com/posts/2012/12/lafd-
stations-in-osm/ (acceso 3 de febrero de 2015).
clxiii
―Prescriber Checkup,‖ ProPublica, https://projects.propublica.org/checkup/
(acceso 3 de febrero de 2015).
clxiv
The Upshot, New York Times, http://www.nytimes.com/upshot/ (acceso 3 de
febrero de 2015).
clxv
D. Leonhardt, ―Back Story: How We Found the Income Data,‖ New York Times,
23 de abr. de 2014, http://www.nytimes.com/2014/04/23/upshot/back-story-how-
we-found-the-income-data.html (acceso 3 de febrero de 2015).
clxvi
A. Cox and J. Katz, ―Senate Model Methodology,‖ New York Times, abr. de
2014, http://www.nytimes.com/newsgraphics/2014/senate-model/methodology.html
(acceso 3 de febrero de 2015).
clxvii
―LEO Senate Model,‖ New York Times, GitHub,
https://github.com/TheUpshot/leo-senate-model (acceso 3 de febrero de 2015).
clxviii
J. Bourgault, ―How the Global Open Data Movement is Transforming
Journalism,‖ Wired, mayo de 2013, http://www.wired.com/2013/05/how-the-global-
open-data-movement-is-transforming-journalism/ (acceso 3 de febrero de 2015).
clxix
J. Ball, ―The Upshot, Vox and FiveThirtyEight: Data Journalism‘s Golden Age,
or TMI?‖ The Guardian Datablog, 22 de abr. de 2014,
http://www.theguardian.com/commentisfree/2014/apr/22/upshot-vox-fivethirtyeight-
data-journalism-golden-age (acceso 3 de febrero de 2015).
clxx
C. Correa, ―Fear Not, Readers: We Have RSS Feeds,‖ 538 DataLab, 28 de
mzo. de 2014, http://fivethirtyeight.com/datalab/fear-not-readers-we-have-rss-
feeds/ (acceso 3 de febrero de 2015).
clxxi
―Data,‖ FiveThirtyEight, GitHub, https://github.com/fivethirtyeight/data (acceso
3 de febrero de 2015).
clxxii
―Statement,‖ TheUpshot, New York Times, GitHub,
https://github.com/TheUpshot/statement (acceso 3 de febrero de 2015).
clxxiii
Vox Media, GitHub, https://github.com/voxmedia (acceso 3 de febrero de
2015).
clxxiv
C. Cross and S. Rogers, ―All our datasets: The Complete Index,‖ The Guardian
Datablog, 14 de en. de 2014,
http://www.theguardian.com/news/datablog/interactive/2013/jan/14/all-our-
datasets-index (acceso 3 de febrero de 2015).
clxxv
D. Kaplan, ―Why Open Data Isn‘t Enough,‖ Global Investigative Journalism
Network, 2 de abr de. 2013, http://gijn.org/2013/04/02/why-open-data-isnt-enough/
(acceso 3 de febrero de 2015).
clxxvi
D. Campbell, ―How ICIJ‘s Project Team Analyzed the Offshore Files,‖
International Consortium of Investigative Journalists, 3 de abr.de 2013,
http://www.icij.org/offshore/how-icijs-project-team-analyzed-offshore-files (acceso
3 de febrero de 2015).
clxxvii
E. Moore, ―Offshore Leaks: A Triumph for Data Journalism,‖ World News
Publishing Focus, 8 de abr. de 2013, http://blog.wan-ifra.org/2013/04/08/offshore-
leaks-a-triumph-for-data-journalism (acceso 3 de febrero de 2015).
clxxviii
―Connected China,‖ Reuters, 2013, http://connectedchina.reuters.com/
(acceso 3 de febrero de 2015).
clxxix
I. Liu, ―Welcome to Connected China,‖ Reuters, 28 de febr. de 2013,
http://blogs.reuters.com/connectedchina/2013/02/28/welcome/ (acceso 3 de
febrero de 2015).
clxxx
A. Heim, ―Poderopedia, a Data Journalism Project to Map the Chilean Elite,‖
The Next Web, 16 de mzo. de 2012,
http://thenextweb.com/media/2012/03/16/poderopedia-a-data-journalism-project-to-
map-the-chilean-elite/ (acceso 3 de febrero de 2015).
clxxxi
A. Howard, ―Data Journalism, Data Tools, and the Newsroom Stack,‖ Radar,
O‘Reilly Media, 5 de jul. de 2011, http://strata.oreilly.com/2011/07/data-journalism-
tools-newsroom-stack.html (acceso 3 de febrero de 2015).
clxxxii
M. Paz, ―Journalists Will Use Poderopedia-powered Platform to Inform Voters
in Panama,‖ Knight Foundation Blog, 2 de febr. de 2014,
http://www.knightfoundation.org/blogs/knightblog/2014/2/21/journalists-will-use-
poderopedia-powered-platform-inform-voters-panama/ (acceso 3 de febrero de
2015).
clxxxiii
P. Navalte, ―Poderopedia, the Chilean Data Journalism Platform, Plans to
Expand to Venezuela and Colombia,‖ Knight Center for Journalism in the
Americas, 6 de nov. de 2013, https://knightcenter.utexas.edu/blog/00-14694-
poderopedia-chilean-data-journalism-platform-plans-expand-venezuela-and-
colombia (acceso 3 de febrero de 2015).
clxxxiv
J. Weiss, ―How Open Data Can Revolutionize Environmental Reporting,‖ PBS
MediaShift, 28 de nov. de 2012, http://www.pbs.org/mediashift/2012/11/how-open-
data-can-revolutionize-environmental-reporting333 (acceso 3 de febrero de 2015).
clxxxv
―NASA Satellite Measures Deforestation,‖ NASA Earth Observatory, 14 de
sep. de 2005, http://earthobservatory.nasa.gov/IOTD/view.php?id=5845 (acceso 3
de febrero de 2015).
clxxxvi
G. Faleiros, ―Geojournalism Handbook Shows How to Capture Earth Science
Knowledge for Reporting,‖ 24 de sep. de 2013, http://ijnet.org/blog/geojournalism-
handbook-shows-how-capture-earth-science-knowledge-reporting (acceso 3 de
febrero de 2015).
clxxxvii
W. Shubert, ―Better Mapping for Better Journalism: InfoAmazonia and the
Growth of GeoJournalism,‖ https://www.internews.org/better-mapping-better-
journalism-infoamazonia-and-growth-geojournalism (acceso 3 de febrero de
2015).
clxxxviii
Oxpeckers Center for Investigative Environmental Journalism,
http://oxpeckers.org/ (acceso 3 de febrero de 2015).
clxxxix
―Land Quest,‖ Internews Kenya, http://landquest.internewskenya.org/ (acceso
3 de febrero de 2015).
cxc
J. Dorroh, ―Data Journalism Site InfoAmazonia Will Add Ground Reporting to its
Environmental Coverage,‖ IJNet, 8 de abr. de 2014, http://ijnet.org/blog/data-
journalism-site-infoamazonia-will-add-ground-reporting-its-environmental-coverage
(acceso 3 de febrero de 2015).
cxci
A. Reid, ―5 Tips on Data Journalism from La Nación,‖ Journalism.co.uk, 6 de
mayo de 2014, http://www.journalism.co.uk/news/5-tips-on-data-journalism-from-la-
nacion/s2/a556641/ (acceso 3 de febrero de 2015).
cxcii
K. Witkin, ―La Nación Multimedia Editor: Innovation is the ‗Antidote‘ to
Journalism Crisis,‖ World News Publishing Focus, 24 de jul. de 2013,
http://blog.wan-ifra.org/2013/07/24/la-nacion-multimedia-editor-innovation-is-the-
antidote-to-journalism-crisis (acceso 3 de febrero de 2015).
cxciii
A. Jiménez, ―How La Nación is Using Data to Challenge a FOIA-free Culture,‖
Nieman Journalism Lab, 23 de mayo 2012,
http://www.niemanlab.org/2012/05/how-la-nacion-is-using-data-to-challenge-a-foia-
free-culture/ (acceso 3 de febrero de 2015).
cxciv
―Argentina‘s Official Advertising Funds Distribution 2009–2013: Friends,
Politicians, and a Stylist,‖ La Nación, 4 de abr. de 2014,
http://blogs.lanacion.com.ar/projects/data/argentina%C2%B4s-official-advertising-
funds-distribution-2009-2013-friends-politicians-and-a-stylist/ (acces3 de febrero
de 2015).
cxcv
―Public Officials Salaries and Assets for Reporting and Accountability,‖ La
Nación, 4 de abr. de 2014, http://blogs.lanacion.com.ar/projects/data/statements-
of-assets/ (acceso 3 de febrero de 2015).
cxcvi
―Monitoring the New Media Law in Argentina 2009–2013,‖ La Nación, 4 de abr.
de 2014, http://blogs.lanacion.com.ar/projects/data/dja-afsca/ (acceso 3 de febrero
de 2015).
cxcvii
―VozData: Collaborating to Free Data from PDFs—The Senate Expenses Part
II,‖ La Nación, 4 de abr. de 2014,
http://blogs.lanacion.com.ar/projects/data/vozdata/ (acceso 3 de febrero de 2015).
cxcviii
―2013 Legislative Elections in Argentina,‖ La Nación, 3 de mzo. de 2014,
http://blogs.lanacion.com.ar/projects/data/2013-legislative-elections-in-argentina/
(acceso 3 de febrero de 2015).
cxcix
―Argentina‘s Senate Expenses 2004–2013,‖ La Nación, 4 de mzo. de 2014,
http://blogs.lanacion.com.ar/ddj/data-driven-investigative-journalism/argentina-
senate-expenses/ (acceso 3 de febrero de 2015).
cc
T. Turner, ―Argentina Imposes Ad Ban, Businesses Say,‖ Wall Street Journal, 8
de febr. de 2013,
http://online.wsj.com/news/articles/SB100014241278873249060045782924337484
98360 (acceso 3 de febrero de 2015).
cci
G. Romero, ―I dati sulla sicurezza sismica delle scuole,‖ Wired Italy, 9 de nov. de
2012, http://daily.wired.it/news/politica/2012/11/09/scuole-sicurezza-terremoto-
143678.html (acceso 3 de febrero de 2015).
ccii
E. Tola, ―Terremoto: la tua scuola è a rischio?‖ Wired Italy, 17 de sep. de 2012,
http://daily.wired.it/news/politica/2012/09/17/terremoto-scuola-rischio.html (acceso
3 de febrero de 2015).
cciii
―La tua scuola è sicura? Cercala sulla mappa,‖ Wired Italy, 9 de nov. de 2012,
http://daily.wired.it/news/politica/2012/11/09/scuolesicure-mappa-scuole-sicurezza-
terremoto-143678.html (acceso 3 de febrero de 2015).
cciv
Government of Italy, http://www.dati.gov.it/ (acceso 3 de febrero de 2015).
ccv
―ForumPA: Il premio Apps4Italy intitolato a Melissa Bassi e alle vittime
dell'attentato di Brindisi | Saperi PA,‖ ForumPA: Il premio Apps4Italy intitolato a
Melissa Bassi e alle vittime dell'attentato di Brindisi | Saperi PA,
http://saperi.forumpa.it/story/74770/forumpa-il-premio-apps4italy-intitolato-melissa-
bassi-e-alle-vittime-dell-attentato-di (acceso 3 de febrero de 2015).
ccvi
G. Romero, ―Di Costanzo, Miur: ‗Rivelare le scuole a rischio sismico è
pericoloso,‖ Wired Italy, 23 de oct. de 2012,
http://daily.wired.it/news/politica/2012/10/23/scuolesicure-anagrafi-scolastiche-
123456.html (acceso 3 de febrero de 2015).
ccvii
A. Howard, ―As Digital Disruption Comes to Africa, Investing in Data Journalism
Takes on New Importance,‖ Radar, O‘Reilly Media, 29 de nov. de 2012,
http://radar.oreilly.com/2012/11/justin-arenstein-africa-data-journalism.html
(acceso 3 de febrero de 2015).
ccviii
―The Challenges Facing Data Journalism in West Africa · Global Voices,‖
Global Voices, 27 de mzo. de 2014, http://globalvoicesonline.org/2014/03/27/the-
challenges-facing-data-journalism-in-west-africa/ (acceso 3 de febrero de 2015).
ccix
J. Arenstein, ―Data Journalism Boosts Voter Registration in Kenya,‖
International Center for Journalists, 24 de nov. de 2012,
http://www.icfj.org/blogs/data-journalism-boosts-voter-registration-kenya (acceso
3 de febrero de 2015).
ccx
P. Butler, ―Data ‗Boot Camp‘ Helps Kenyan Reporter Expose School Sanitation
Woes,‖ International Center for Journalists, 6 de dic.de 2012,
http://www.icfj.org/news/data-%E2%80%9Cboot-camp%E2%80%9D-helps-
kenyan-reporter-expose-school-sanitation-woes (acceso 3 de febrero de 2015).
IV. Ejemplos Notables
―El proyecto del que estoy más orgulloso es el que hice antes de SOAP Opera,
que fue nuestro proyecto de 2010 'Dollars for Docs‘‖ (Dólares para médicos) dijo
Dan Nguyen, entonces programador en ProPublica. ―Comenzó con solo un
comentario que escribí en un blog para mostrar a otros periodistas la utilidad del
scraping en la red.cxxii En este caso extraje datos de un sitio que Pfizer usaba para
dar a conocer lo que pagaba a médicos que hacen trabajos de promoción y
consultoría. Mis colegas le prestaron atención y dijeron que podíamos hacer lo
mismo en todas las compañías que dieran a conocer sus pagos. Debido a que
cada firma daba a conocer estos pagos en una variedad de formatos, incluyendo
contenedores Flash y PDF, poca gente había tratado de analizar estos informes
de conjunto para ver las tendencias nacionales en estas relaciones financieras‖.
Nguyen explicó que el equipo de ProPublica hizo docenas de programas para
extraer datos que permitieron hacer referencias cruzadas de las bases datos de
pagos con listados de las direcciones médicas estaduales y distintas facultades de
medicina. ―Para el informe inicial hicimos equipo con otras cinco redacciones,
incluyendo NPR y el Boston Globe, lo que requirió programáticamente crear un
sistema en el que pudiéramos coordinar datos e investigaciones‖, dijo. ―Por la gran
cantidad de datos que obteníamos y la cantidad de reporteros y editores
trabajando en esto por fuera de nuestras oficinas, este no podía ser un proyecto
exitoso solo con intercambiar archivos Excel‖.cxxiii
El proyecto ―Dollars for Docs‖ muestra cómo el periodismo basado en datos puede
derivar en un impacto sobre pacientes, proveedores, compañías privadas y
universidades; en síntesis, todo el sector de la salud.
―El sitio que construimos basado en esos datos es el más visitado de todos
nuestros proyectos, ya que fueron millones las personas que lo usaron para
buscar sus médicos‖ dijo Nguyen. ―Luego compartimos nuestros datos con
cualquier fuente informativa que los pidiera, por lo que cientos de informes
independientes, también se basaron en nuestros datos. Entre los resultados
obtenidos contamos con el que se dio en las compañías farmacéuticas y las
facultades de medicina quienes reanalizaron sus políticas para tales iniciativas y
para los conflictos de intereses.‖
En 2013, la emisora de radio pública de la ciudad de New York pidió a los oyentes
que ayudaran a rastrear la aparición de cigarras con sensores de bajo costo. El
proyecto ―Cicada Tracker‖ (Rastreador de Cigarras) registró alrededor de 8000
vistas de cigarras con 800 personas fabricando sus propios rastreadores.cxxiii El
proyecto hizo realidad -y no meramente una teoría- la recolección de datos por el
públicocxxix por medio de periodismo de sensorescxxx y una audiencia diseminada,
lo que resultó en 15.000 lecturas de temperatura. Las lecciones del proyecto del
rastreador de cigarras debiera orientar los futuros esfuerzos de los medios
públicos para promover la participación de la práctica de ciencia y recolección de
datos directa por parte de los ciudadanos. Para una observación más profunda en
el tema, vea las actas del taller de periodismo de sensores del Tow Center del año
pasado.cxxxi
A fines de 2013, el equipo de Visuales de NPR difundió un proyecto en torno de
plazas con juegos accesibles. NPR hizo un pedido a su comunidad de audiencia y
lectores: Ayuden a los medios púbicos a recolectar datos y hagan que el recurso
sea mejor para todos. La aplicación de plazas con juegos NPR permite a padres y
niños buscar plazas accesibles, utilizando los motores de búsqueda comúnmente
usados por los consumidores y combinándolos con un importante elemento de
servicio público.cxxxii
―Esto es parecido a Yelp, salvo que es para plazas, con juegos para chicos con
necesidades especiales‖ dijo Brian Boyer, jefe del equipo de Visuales de NPR en
una entrevista. ―Es la primera en su tipo, una base de datos nacional de plazas
con juegos que se adaptan a chicos en silla de ruedas, chicos con autismo o
chicos con otras necesidades especiales.‖
NPR incentivó a su púbico para que sean activos participantes en la recolección
de datos, del mismo modo que la ―Cuenta de Pájaros de Navidad‖ de Audubon‖ y
eBird recurren al público para recoger datos acerca de especies de pájaros.cxxxiii
En las primeras 48 horas, luego del lanzamiento de la aplicación, se agregaron a
la base de datos 336 plazas, dentro de un total de 1293. En mayo de 2014, la
aplicación de las plazas, tenía 19.078 entradas y seguía creciendo.
La aplicación es un caso notable de estudio respecto de la incorporación del
público y la creación de datos a través de las multitudes. Hay décadas de
antecedentes de públicos que colaboran con una organización de medios en la
recolección de imágenes, vídeos o informes.
Lo que sigue siendo relativamente nuevo es la capacidad de una multitud en red
de aportar datos, vengan de sensores en sequíascxxxiv o contadores geigercxxxv
cercanos a fuentes potenciales de radicación. Si convertir datos en informes es
actualmente un elemento central en el periodismo de investigación, los equipos de
visuales de WNYC y NPR han mostrado la mejor forma de hacerlo, y servir al
público en ese camino. cxxxvi
d. Servicio Público
El Datablog y sus editores establecieron una norma importante que muchos otros
periodistas de datos siguen abrazando: muestre su trabajo y comparta sus datos.
Yo hice un perfil del trabajo de periodismo de datos del Los Angeles Times a
comienzos de 2013, cuando entrevisté al programador de noticias Ben Welsh
acerca del DataDesk del diario.cli El equipo relativamente pequeño de reporteros y
programadores de la red se especializa en mapas, bases de datos, análisis y
visualizaciones. Por ejemplo, una visualización interactiva presentaba el mapa de
la velocidad de respuesta del departamento de bomberos de Los Ángeles a las
llamadas recibidas.clii La visualización fue parte de una serie más larga sobre la
distribución de las llamadas al 911 en el distrito de LA, cliii que combinó el
periodismo de investigación con análisis de datos para crear narrativas
importantes y llamativas que obligaron al gobierno a rendir cuentas y demostraron
que existen problemas significativos en la recolección de datos que hace la
ciudad.
La investigación ofreció una visión que no pierde actualidad y que perdurará más
allá de la ―era de los grandes datos‖: las malas prácticas de recolección de datos y
una TI (Tecnología Informática) envejecida descarrilará todos los esfuerzos
institucionales por usar el análisis de datos para mejorar el desempeño.
El Los Angeles Times descubrió que el mal registro de los datos está trabando los
esfuerzos del gobierno estadual por mejorar el sistema del 911 de California. Tal
como sucede con cualquier proyecto de bases de datos, hay que rechazar el
sistema de ―basura que entra, basura que sale‖ (en inglés se lo conoce como
―garbage in, garbage out‖ o ―GIGO‖.)
Como informaron Ben Welsh y Robert J. López del L.A. Times en diciembre de
2012, la Autoridad de Servicios Médicos de Emergencia de California ha estado
trabajando para centralizar datos de desempeño desde 2009. Desgraciadamente,
es difícil lograr mejoras basadas en datos o subrayar problemas percibidos en los
grandes conjuntos de información del área pública, si la recolección misma de
datos tiene fallas.cliv El L.A. Times informó de problemas de calidad derivados
tanto de cómo se mide los tiempos de respuesta, cómo se hace el registro de
datos en papel, y hasta casos en que directamente no se guardó registro.
Cuando hice el análisis del trabajo de Ben Welsh en 2012, me dijo que este
proyecto es exactamente el tipo de trabajo del que está más orgulloso. ―Como
sabemos hay muchos datos por ahí‖ dijo Welsh. ―Y como lo sabe cualquiera que
trabaja con esos datos, la mayor parte es basura. Los proyectos de los que estoy
más orgulloso han tomado grandes conjuntos de datos sucios y los han refinados
hasta convertirlos en algo que vale la pena saber: un gráfico sintético en una
historia de investigación o una aplicación basada en datos que da al lector alguna
visión nueva del mundo que lo rodea.‖clv
Más al norte, en California, un nuevo experimento está aplicando el periodismo de
datos a la transparencia del gobierno municipal en Oakland, es un sitio llamado
Oakland Police Beat que empezó a funcionar en la primavera boreal de 2014.clvi
Es sitio un espacio sin fines de lucro, que es parte de Oakland Local y el Center
for Media Change (Centro para Cambios en los Medios) -y con financiación de
Ethics and Excellence in Journalism Foundation (Fundación de Ética y excelencia
en el Periodismo) y el Fund for Investigative Journalism (Fondo para el Periodismo
de Investigación)- fue fundado conjuntamente por Susan Mernit y Abraham Hyatt,
ex editor ejecutivo de ReadWrite. (Para que se sepa. Haytt editó lo que publiqué
allí.)
Oakland Police Beat está dedicado directamente a echar luz sobre las prácticas de
los agentes de la ley de Oakland. Su primer informe no se anduvo con vueltas,
descubriendo que los agentes más condecorados de Oakland eran objeto de
cantidades de demandas por brutalidad y responsables de numerosos tiroteos.
El sitio demostró dos prácticas importantes que merecen convertirse en la norma
del periodismo de datos: explicar la metodología que sostiene su análisis,
incluyendo las notas de fuentes, y la publicación (eventualmente) de los datos
detrás de la investigación.
ProPublica lo hace, el Datablog lo hace y también el Los Angeles Times. El Data
Desk del Times estableció un estándar más elevado en su investigación del
tiempo de respuesta de las ambulancias, no sólo encontrándole sentido a los
datos, sino también publicando los datos que son la base para los mapas de
código abierto de los entes de emergencias médicas de California, como parte de
una serie sobre el dominio público.clvii
Esta no fue la primera vez que el equipo puso a disposición del público su código,
ni sería la última (Basta visitar la cuenta Github del Data Desk para tener pruebas
de ello.)clviii Como señaló Welsh en un comentario online sobre la serie,clix el Data
Desk ha ―comunicado previamente sobre los métodos técnicosclx usados para
realizar [la] investigación, difundió la capa de base creada para un mapa
interactivo de tiempos de respuesta,clxi y contribuido con la ubicación de las 106
estaciones del departamento de bomberos de Los Ángeles (LAFD) en el Mapa de
Calles Abierto.clxii
Scott Klein ofreció el siguiente comentario:
Si se hace bien, la gente tiene realmente mucho apetito por ver los datos. Es
suficiente ver cuanta gente entiende -y le encantan- estadísticas deportivas
increíblemente sofisticadas e impenetrables. Debiéramos poder confiar en
que nuestros lectores comprenderán datos en otros contextos también. Si
hacemos un buen trabajo, la mayoría de la gente debería poder entrar a
nuestra aplicación noticiosa Prescriber Checkup (Control de Recetadores),clxiii
buscar sus médicos, y comparar su patrón de recetas con el de sus pares,
además de entender lo que está en juego y qué hacer con la información que
encuentra.
Como subrayó David Kaplan, director del Global Investigative Journalism Network
(Red de Periodismo de Investigación Global), las grandes bases de datos, el
análisis de las redes y el código no reemplazan el periodismo de investigación. clxxv
Estas tecnologías aumentan y extienden las posibilidades de las organizaciones
de medios, investigadores solitarios o incluso equipos de periodistas trabajando en
cooperación a través de fronteras y zonas horarias. Este tipo de colaboración pasó
de ser algo potencial a convertirse en realidad en los últimos tres años, cuando un
equipo de más de 80 periodistas de 40 países diferentes trabajaron juntos para
crear un mapa mundial de trusts secretos y compañías offshore.
El International Consortium of Investigative Journalists (Consorcio Internacional de
Periodistas de Investigación) analizó 260 gigabytes de datos corporativos
trascendidos en la forma de texto, PDF, imágenes y hojas de cálculo para revelar
cómo funcionarios estatales estaban sacando dinero de sus países, cómo estaban
involucrados distintos bancos en esta práctica, y cómo usa las mismas estructuras
el crimen organizado.clxxxvi ―Offshore Leaks‖ es un triunfo para el periodismo de
datos.clxxvii Es probable que este modelo se refine y sea aplicado nuevamente en el
futuro.
El proyecto ―representa un nuevo enfoque para Reuters News‖, escribió Liu. ―Es
un modelo, utilizar lo que informamos todos los días respecto de personas,
instituciones, el poder y las relaciones y ponerlo en un formato que le da
significado sostenido en el tiempo‖. Y agregó:
Ley de Medios: El 94% de los medios creados con la nueva ley es estatal.cxcvi
http://blogs.lanacion.com.ar/projects/data/ley-de-medios-el-94-de-los-medios-
creados-con-la-nueva-ley-es-estatal/
Elecciones 2013: abrimos los datos de los centros de votación geolocalizados. cxcviii
http://blogs.lanacion.com.ar/data/sin-categoria/elecciones-2013-abrimos-los-datos-
de-los-centros-de-votacion-geolocalizados/
http://blogs.lanacion.com.ar/projects/data/gastos-del-senado/
Guido Romero, editor de ciencias de Wired Italy que publicó el trabajo, compartió
algo más acerca de la historia detrás del proyecto por correo electrónico.
―En Italia hay unos 50.000 edificios escolares‖, dijo Romero. ―Protezione Civile, la
agencia federal de manejo de emergencia italiana, estima que 22.500 de ellas
deben ser chequeadas para verificar su seguridad sísmica. La población escolar
total italiana es de ocho millones (estudiantes + docentes + personal), por lo que
usted puede ver lo relevante de este problema.‖
La historia detrás del proyecto de Wired Italy subrayó un desafío en Italia que
existe en muchos otros lugares del mundo: cómo puede practicarse el periodismo
de datos en países que no tienen una ley de Acceso a la Información Pública o
una tradición de transparencia respecto de las acciones y el gasto público.
El gobierno italiano, que viene muy a la zaga del Reino Unido, ha puesto más
datos abiertos a disposicióncciv desde que lanzó una plataforma nacional en
2011.ccv En este caso, sin embargo, los únicos datos que el Ministerio de
Educación Italiano difundió fue una lista de edificios escolares publicado online.
Como dije antes, Tola y su equipo sumaron o crearon el resto de los datos usados
en el proyecto, por medio de extracción y procesado de PDF de datos de gasto de
sitios en la red de gobiernos regionales, y luego, agregaron la geo-localización en
cooperación con un programador local.
Los medios en todo África enfrentan estos desafíos y aún más, batallando con
funcionarios públicos obstinados, registros en papel, inexistencia de leyes de
información y amenazas abiertas y violencia física contra periodistas. Ahora
adquiere nuevo relieve el desarrollo de la capacidad de los medios africanos de
practicar el periodismo basado en datos, al introducirse en los países del
continente la conmoción digital que ha alterado permanentemente los modelos de
países más desarrollados.ccvii Son significativos los desafíos que el periodismo de
datos enfrenta en África Occidental, aunque no son distintos de los que se ven en
otras partes del continente.ccviii
Justin Arenstein, un periodista de investigación sudafricano, es decidido partidario
del periodismo basado en datos que no sólo le encuentra un sentido al mundo a
los lectores y espectadores, sino que también les aporta herramientas para
involucrarse más en el cambio de las condiciones que conocen a través de ese
trabajo. Por ejemplo, el periodismo de datos dio impulso al registro de votantes en
Kenia,ccix creando un sitio simple que usa herramientas y tecnologías modernas
con base en la red.
Un ―encuentro de datos‖ en Kenia en 2012 condujo a otro excelente ejemplo de
esta dinámica. Arenstein explicó:
NTV, el canal nacional de aire gratuito, había estado estudiando por qué
chicas jóvenes en una zona rural de Kenia rendían muy bien
académicamente hasta la edad de 11 o 12 años y luego desparecían por
completo del registro académico o su desempeño caía a pique. La
explicación de las autoridades se basaba en que esto es simplemente algo
tradicional; es tribal. Las familias las sacan de la escuela para hacer tareas y
ocuparse de la casa y, como resultado de ello, no pueden rendir en la
escuela.
Resultó que esta era una conclusión incorrecta. Irene Choge, una periodista
keniata que participó de la capacitación en periodismo de datos, comenzó a
recuperar los datos disponibles y los registros públicos. Choge primero analizó los
registros médicos para ver si tenía incidencia el cólera. Luego examinó los
registros de agua e infraestructura física. Fue allí donde encontró una correlación
clave: las escuelas que mostraban las peores caídas en el desempeño académico
de niñas adolescentes eran las que no tenían instalaciones sanitarias.
Choge subsecuentemente trabajó con programadores para crear una aplicación
simple basada en mensajes SMS que permite a los padres determinar la
comparación entre escuelas y, reclamar cambios. Su trabajo informando de
problemas sanitarios en escuelas ha llevado a funcionarios a reorientar recursos
hacia la construcción de instalaciones sanitarias.ccx
Aunque tales aplicaciones se adentran en los dominios de los reclamos políticos y
la participación ciudadana que pueden resultar incómodos para muchos
periodistas, el crecimiento de servicios que abarcan la intersección entre el
gobierno abierto y el periodismo de datos continuará siendo un terreno importante
y fértil en los próximos años.
NOTAS
cix
A. Howard, ―Open Government Data Shines a Light on Hospital Billing and
Health Care Costs,‖ E Pluribus Unum., 8 de mayo de 2013, http://e-
pluribusunum.com/2013/05/08/open-government-data-hospital-billing-healthcare-
cost/ (acceso 3 de febrero de 2015).
cx
A. Howard, ―Medicare Release and DATA Act Signal Major Events in the Age of
Data Transparency,‖TechRepublic, 15 de abr. de 2014,
http://www.techrepublic.com/article/medicare-release-and-data-act-signal-major-
events-in-the-age-of-data-transparency/ (acceso 3 de febrero de 2015).
cxi
P. Reese and D. Smith, ―Million-dollar Hospital Bills Rise Sharply in Northern
California,‖ The Sacramento Bee, 11 de mzo. de 2012,
http://www.sacbee.com/2012/03/11/4328036/million-dollar-hospital-bills.html
(acceso 3 de febrero de 2015).
cxii
―Patient Safety,‖ The Dallas Morning News Investigations and Special Reports,
2012, http://www.dallasnews.com/investigations/patient-safety/ (acceso 23 de
mayo de 2014).
cxiii
L. Girion, S. Glover, and D. Smith, ―Drugs Deaths Now Outnumber Traffic
Fatalities in U.S., Data Show,‖ Los Angeles Times, 17 de sep. de 2011,
http://articles.latimes.com/2011/sep/17/local/la-me-drugs-epidemic-20110918
(acceso 3 de febrero de 2015)
cxiv
B. Sanderlin, ―Fake Medical Providers Slip Through Medicare Loophole,‖
Atlanta Journal-Constitution, 2 de dic.de 2012,
http://www.ajc.com/news/news/fake-medical-providers-slip-through-medicare-
looph/nTLFF/ (acceso 3 de febrero de 2015).
cxv
―Medical Helicopter Flights Mostly for Routine Transport, Argus Leader, via IRE,
http://www.ire.org/blog/extra-extra/2012/12/03/hospital-helicopters-worth-cost/
(acceso 3 de febrero de 2015).
cxvi
―Election Results,‖ New York Times, 2012,
http://elections.nytimes.com/2012/results/president (acceso 3 de febrero de 2015).
cxvii
―Toxic Waters,‖ New York Times, 2009–2010, http://projects.nytimes.com/toxic-
waters (acceso 3 de febrero de 2015).
cxviii
―U.S. Congressional Votes Database,‖ Washington Post, 2005,
http://projects.washingtonpost.com/congress/113/ (acceso 3 de febrero de 2015).
cxix
―Philip Meyer Journalism Awards,‖ Investigative Reporters and Editors,
http://www.ire.org/awards/philip-meyer-awards/ (acceso 3 de febrero de 2015).
cxx
―Data Journalism Awards de 2014,‖ Global Editors Network,
http://www.globaleditorsnetwork.org/programmes/data-journalism-awards/ (acceso
3 de febrero de 2015).
cxxi
―The Prescribers,‖ ProPublica, 2013–de 2014,
http://www.propublica.org/series/prescribers (acceso 3 de febrero de 2015).
cxxii
―Dollars for Docs,‖ ProPublica, http://projects.propublica.org/docdollars/
(acceso 3 de febrero de 2015).
cxxiii
D. Nguyen, ―Scraping for Journalism: A Guide for Collecting Data,‖ ProPublica,
30 dic de. 2010, http://www.propublica.org/nerds/item/doc-dollars-guides-
collecting-the-data (acceso 3 de febrero de 2015).
cxxiv
J. Merrill, A. Shaw, and A. Zamora, ―Free the Files,‖ ProPublica, 21 de mayo de
2014, https://projects.propublica.org/free-the-files/ (acceso 3 de febrero de 2015).
cxxv
J. Elliot, ―Political Ad Data Comes Online — But It‘s Not Searchable,‖
ProPublica, 2 de ag.de 2012, http://www.propublica.org/article/political-ad-data-
comes-online-but-its-not-searchable (acceso 3 de febrero de 2015).
cxxvi
A. Shaw, ―Transcribable: Free the Files to Go!‖ ProPublica, 16 de jul.de 2013,
http://www.propublica.org/nerds/item/transcribable-free-the-files-to-go (acceso 3
de febrero de 2015).
cxxvii
A. Zamora, ―Crowdsourcing Campaign Spending: What We Learned From
Free the Files, ‖ProPublica, 12 de dic.de 2012,
http://www.propublica.org/article/crowdsourcing-campaign-spending-what-we-
learned-from-free-the-files (acceso 3 de febrero de 2015).
cxxviii
―Cicada Tracker,‖ WNYC, http://project.wnyc.org/cicadas/ , mayo de 2013,
(acceso 3 de febrero de 2015).
cxxix
C. Donovan, ―The Cicadas Are Here: 4 Lessons From WNYC‘s Cicada Tracker
Project,‖ Nieman Journalism Lab, 3 de junio de 2013,
http://www.niemanlab.org/2013/06/the-cicadas-are-here-4-lessons-from-wnycs-
cicada-tracker-project/ (acceso 3 de febrero de 2015).
cxxx
A. Howard, ―Sensoring the News,‖ Radar, O'Reilly Media, 22 de mzo. de 2013,
http://radar.oreilly.com/2013/03/sensor-journalism-data-journalism.html (acceso 3
de febrero de 2015).
cxxxi
Tow Center for Digital Journalism, Columbia University, Sensor Journalism
Workshop, junio 1-2, 2013, http://towcenter.org/research/sensor-journalism-at-the-
tow-center/sensor-journalism-workshop-at-the-tow-center/ (acceso 23 de mayo de
2014).
cxxxii
―Playgrounds for Everyone,‖ NPR, http://apps.npr.org/playgrounds/ (acceso 3
de febrero de 2015).
cxxxiii
J. Robbins, ―Crowdsourcing, for the Birds,‖ New York Times, 19 de ag. de
2013, http://www.nytimes.com/2013/08/20/science/earth/crowdsourcing-for-the-
birds.html?pagewanted=all (acceso 3 de febrero de 2015).
cxxxiv
M. Waite, ―Slouching Toward Sensor Journalism,‖ Source, OpenNews, 11
junio de 2013, https://source.opennews.org/en-US/articles/slouching-toward-
sensor-journalism/ (acceso 3 de febrero de 2015).
cxxxv
E. Zuckerman, ―Citizen Science Versus NIMBY?‖ ―My Heart's in Accra,‖ 29 de
ag. de 2013, http://www.ethanzuckerman.com/blog/2013/08/29/citizen-science-
versus-nimby/ (acceso 3 de febrero de 2015).
cxxxvi
A. Miars, ―NPR‘s Apps Editor Brian Boyer Turns Data into Stories,‖ It‘s All
Journalism, 6 de jul. de 2013, http://itsalljournalism.com/nprs-apps-editor-brian-
boyer-turns-data-into-stories/ (acceso 3 de febrero de 2015).
cxxxvii
The Guardian Datablog, http://www.theguardian.com/news/datablog (acceso
3 de febrero de 2015).
cxxxviii
J. Burn-Murdoch, ―Mapping Racist Tweets in Response to President Obama‘s
re-election,‖The Guardian Datablog, 9 de nov. de 2012,
http://www.theguardian.com/news/datablog/2012/nov/09/mapping-racist-tweets-
president-obama-reelection (acceso 3 de febrero de 2015).
cxxxix
S. Rogers, ―Government Spending by Department, 2011–12,‖ The Guardian
Datablog, 4 de dic.de 2012,
http://www.theguardian.com/news/datablog/2012/dec/04/government-spending-
department-2011-12 (acceso 3 de febrero de 2015).
cxl
S. Rogers, ―Named and Shamed: The Worst Government Annual Reports,
2012,‖ The Guardian Datablog, 4 de dic.de 2012,
http://www.theguardian.com/news/datablog/2012/dec/04/departmental-reports-
worst-named-shamed (acceso 3 de febrero de 2015).
cxli
S. Rogers, ―Gun Crime Statistics by U.S. State: Latest Data,‖ The Guardian
Datablog, 10 de en. de 2011,
http://www.theguardian.com/news/datablog/2011/jan/10/gun-crime-us-state
(acceso 3 de febrero de 2015).
cxlii
S. Rogers, ―The Gun Ownership and Gun Homicides Murder Map of the World,‖
The Guardian Datablog, 22 de jul. de 2012,
http://www.theguardian.com/news/datablog/interactive/2012/jul/22/gun-ownership-
homicides-map (acceso 3 de febrero de 2015).
cxliii
A. Howard, ―UK Cabinet Office Relaunches Data.gov.uk, Releases Open Data
White Paper,‖ Radar, O'Reilly Media, 29 junio de 2012,
http://strata.oreilly.com/2012/06/uk-cabinet-office-relaunches-d.html (acceso 3 de
febrero de 2015).
cxliv
A. Howard, ―Open Data 500: Proof That Open Data Fuels Economic Activity,‖
TechRepublic, 8 de abr. de 2014, http://www.techrepublic.com/article/open-data-
500-proof-that-open-data-fuels-economic-activity/ (acceso 3 de febrero de 2015).
cxlv
A. Howard, ―Finding and Telling Data-driven Stories in Billions of Tweets,‖
Radar, O'Reilly Media, 18 de abr.de 2013, http://strata.oreilly.com/2013/04/finding-
and-telling-data-driven-stories-in-billions-of-tweets.html (acceso 3 de febrero de
2015).
cxlvi
S. Rogers, ―Simon Rogers on Data Journalism in the Open,‖ Tow Center for
Digital Journalism, 25 de mzo. de 2014,
http://digiphile.tumblr.com/post/80800219507/simon-rogers-on-data-journalism-in-
the-open (acceso 3 de febrero de 2015).
cxlvii
J. Cheshire, Spatial.ly, http://spatialanalysis.co.uk/ (acceso 3 de febrero de
2015).
cxlviii
Oxford Internet Institute, http://www.floatingsheep.org/ (acceso 3 de febrero de
2015).
cxlix
―Data Desk,‖ Shaw Media, http://globalnews.ca/data-desk/ (acceso 3 de
febrero de 2015).
cl
―On Oklahoma Tornado Damage,‖ NPR, http://apps.npr.org/moore-oklahoma-
tornado-damage/ (acceso 3 de febrero de 2015).
cli
A. Howard, ―Profile of the Data Journalist: The Human Algorithm,‖ Radar, O'Reilly
Media, 2 de mzo. de 2013, http://strata.oreilly.com/2012/03/profile-of-the-data-
journalist-2.html (acceso 3 de febrero de 2015).
clii
―Map: How Fast is LAFD Where you Live?" Los Angeles Times,
http://graphics.latimes.com/how-fast-is-lafd (acceso 3 de febrero de 2015).
cliii
―911 Breakdowns at LAFD,‖ Los Angeles Times, 2012,
http://www.latimes.com/local/lafddata/ (acceso 3 de febrero de 2015).
cliv
R. Lopez and B. Welsh, ―Flawed Data Stall California‘s 911 Upgrades,‖ Los
Angeles Times, 21 de dic.de 2012, http://articles.latimes.com/2012/dec/21/local/la-
me-ems-data-problems-20121222 (acceso 3 de febrero de 2015).
clv
A. Howard, ―Profile of the Data Journalist: The Human Algorithm,‖ 2 de mzo. de
2013.
clvi
Oakland Police Beat, de 2014, http://oaklandpolicebeat.com/ (acceso 3 de
febrero de 2015).
clvii
―Open-source Maps of California‘s Emergency Medical Agencies,‖ Los Angeles
Times, dic.de 2012, http://datadesk.latimes.com/posts/2012/12/map-of-california-
ems-agencies/ (acceso 3 de febrero de 2015).
clviii
Los Angeles Times Data Desk, GitHub, https://github.com/datadesk (acceso 3
de febrero de 2015).
clix
B. Welsh, ―Inside Our 911 Response Time Analysis,‖ Los Angeles Times, 20 de
oct. de 2012, http://datadesk.latimes.com/posts/2012/10/lafd-border-analysis/
(acceso 3 de febrero de 2015).
clx
B. Welsh, ―Introducing Quiet L.A.,‖ Los Angeles Times, 14 de nov. de 2012,
http://datadesk.latimes.com/posts/2012/11/introducing-quiet-la/ (acceso 3 de
febrero de 2015).
clxi
―Map: How Fast is LAFD Where you Live?" Los Angeles Times,
http://graphics.latimes.com/how-fast-is-lafd (acceso 3 de febrero de 2015).
clxii
B. Welsh, ―The Times Contributes LAFD Fire Stations to OpenStreetMap,‖ Los
Angeles Times, 6 de dic.de 2012, http://datadesk.latimes.com/posts/2012/12/lafd-
stations-in-osm/ (acceso 3 de febrero de 2015).
clxiii
―Prescriber Checkup,‖ ProPublica, https://projects.propublica.org/checkup/
(acceso 3 de febrero de 2015).
clxiv
The Upshot, New York Times, http://www.nytimes.com/upshot/ (acceso 3 de
febrero de 2015).
clxv
D. Leonhardt, ―Back Story: How We Found the Income Data,‖ New York Times,
23 de abr. de 2014, http://www.nytimes.com/2014/04/23/upshot/back-story-how-
we-found-the-income-data.html (acceso 3 de febrero de 2015).
clxvi
A. Cox and J. Katz, ―Senate Model Methodology,‖ New York Times, abr. de
2014, http://www.nytimes.com/newsgraphics/2014/senate-model/methodology.html
(acceso 3 de febrero de 2015).
clxvii
―LEO Senate Model,‖ New York Times, GitHub,
https://github.com/TheUpshot/leo-senate-model (acceso 3 de febrero de 2015).
clxviii
J. Bourgault, ―How the Global Open Data Movement is Transforming
Journalism,‖ Wired, mayo de 2013, http://www.wired.com/2013/05/how-the-global-
open-data-movement-is-transforming-journalism/ (acceso 3 de febrero de 2015).
clxix
J. Ball, ―The Upshot, Vox and FiveThirtyEight: Data Journalism‘s Golden Age,
or TMI?‖ The Guardian Datablog, 22 de abr. de 2014,
http://www.theguardian.com/commentisfree/2014/apr/22/upshot-vox-fivethirtyeight-
data-journalism-golden-age (acceso 3 de febrero de 2015).
clxx
C. Correa, ―Fear Not, Readers: We Have RSS Feeds,‖ 538 DataLab, 28 de
mzo. de 2014, http://fivethirtyeight.com/datalab/fear-not-readers-we-have-rss-
feeds/ (acceso 3 de febrero de 2015).
clxxi
―Data,‖ FiveThirtyEight, GitHub, https://github.com/fivethirtyeight/data (acceso
3 de febrero de 2015).
clxxii
―Statement,‖ TheUpshot, New York Times, GitHub,
https://github.com/TheUpshot/statement (acceso 3 de febrero de 2015).
clxxiii
Vox Media, GitHub, https://github.com/voxmedia (acceso 3 de febrero de
2015).
clxxiv
C. Cross and S. Rogers, ―All our datasets: The Complete Index,‖ The Guardian
Datablog, 14 de en. de 2014,
http://www.theguardian.com/news/datablog/interactive/2013/jan/14/all-our-
datasets-index (acceso 3 de febrero de 2015).
clxxv
D. Kaplan, ―Why Open Data Isn‘t Enough,‖ Global Investigative Journalism
Network, 2 de abr de. 2013, http://gijn.org/2013/04/02/why-open-data-isnt-enough/
(acceso 3 de febrero de 2015).
clxxvi
D. Campbell, ―How ICIJ‘s Project Team Analyzed the Offshore Files,‖
International Consortium of Investigative Journalists, 3 de abr.de 2013,
http://www.icij.org/offshore/how-icijs-project-team-analyzed-offshore-files (acceso
3 de febrero de 2015).
clxxvii
E. Moore, ―Offshore Leaks: A Triumph for Data Journalism,‖ World News
Publishing Focus, 8 de abr. de 2013, http://blog.wan-ifra.org/2013/04/08/offshore-
leaks-a-triumph-for-data-journalism (acceso 3 de febrero de 2015).
clxxviii
―Connected China,‖ Reuters, 2013, http://connectedchina.reuters.com/
(acceso 3 de febrero de 2015).
clxxix
I. Liu, ―Welcome to Connected China,‖ Reuters, 28 de febr. de 2013,
http://blogs.reuters.com/connectedchina/2013/02/28/welcome/ (acceso 3 de
febrero de 2015).
clxxx
A. Heim, ―Poderopedia, a Data Journalism Project to Map the Chilean Elite,‖
The Next Web, 16 de mzo. de 2012,
http://thenextweb.com/media/2012/03/16/poderopedia-a-data-journalism-project-to-
map-the-chilean-elite/ (acceso 3 de febrero de 2015).
clxxxi
A. Howard, ―Data Journalism, Data Tools, and the Newsroom Stack,‖ Radar,
O‘Reilly Media, 5 de jul. de 2011, http://strata.oreilly.com/2011/07/data-journalism-
tools-newsroom-stack.html (acceso 3 de febrero de 2015).
clxxxii
M. Paz, ―Journalists Will Use Poderopedia-powered Platform to Inform Voters
in Panama,‖ Knight Foundation Blog, 2 de febr. de 2014,
http://www.knightfoundation.org/blogs/knightblog/2014/2/21/journalists-will-use-
poderopedia-powered-platform-inform-voters-panama/ (acceso 3 de febrero de
2015).
clxxxiii
P. Navalte, ―Poderopedia, the Chilean Data Journalism Platform, Plans to
Expand to Venezuela and Colombia,‖ Knight Center for Journalism in the
Americas, 6 de nov. de 2013, https://knightcenter.utexas.edu/blog/00-14694-
poderopedia-chilean-data-journalism-platform-plans-expand-venezuela-and-
colombia (acceso 3 de febrero de 2015).
clxxxiv
J. Weiss, ―How Open Data Can Revolutionize Environmental Reporting,‖ PBS
MediaShift, 28 de nov. de 2012, http://www.pbs.org/mediashift/2012/11/how-open-
data-can-revolutionize-environmental-reporting333 (acceso 3 de febrero de 2015).
clxxxv
―NASA Satellite Measures Deforestation,‖ NASA Earth Observatory, 14 de
sep. de 2005, http://earthobservatory.nasa.gov/IOTD/view.php?id=5845 (acceso 3
de febrero de 2015).
clxxxvi
G. Faleiros, ―Geojournalism Handbook Shows How to Capture Earth Science
Knowledge for Reporting,‖ 24 de sep. de 2013, http://ijnet.org/blog/geojournalism-
handbook-shows-how-capture-earth-science-knowledge-reporting (acceso 3 de
febrero de 2015).
clxxxvii
W. Shubert, ―Better Mapping for Better Journalism: InfoAmazonia and the
Growth of GeoJournalism,‖ https://www.internews.org/better-mapping-better-
journalism-infoamazonia-and-growth-geojournalism (acceso 3 de febrero de
2015).
clxxxviii
Oxpeckers Center for Investigative Environmental Journalism,
http://oxpeckers.org/ (acceso 3 de febrero de 2015).
clxxxix
―Land Quest,‖ Internews Kenya, http://landquest.internewskenya.org/ (acceso
3 de febrero de 2015).
cxc
J. Dorroh, ―Data Journalism Site InfoAmazonia Will Add Ground Reporting to its
Environmental Coverage,‖ IJNet, 8 de abr. de 2014, http://ijnet.org/blog/data-
journalism-site-infoamazonia-will-add-ground-reporting-its-environmental-coverage
(acceso 3 de febrero de 2015).
cxci
A. Reid, ―5 Tips on Data Journalism from La Nación,‖ Journalism.co.uk, 6 de
mayo de 2014, http://www.journalism.co.uk/news/5-tips-on-data-journalism-from-la-
nacion/s2/a556641/ (acceso 3 de febrero de 2015).
cxcii
K. Witkin, ―La Nación Multimedia Editor: Innovation is the ‗Antidote‘ to
Journalism Crisis,‖ World News Publishing Focus, 24 de jul. de 2013,
http://blog.wan-ifra.org/2013/07/24/la-nacion-multimedia-editor-innovation-is-the-
antidote-to-journalism-crisis (acceso 3 de febrero de 2015).
cxciii
A. Jiménez, ―How La Nación is Using Data to Challenge a FOIA-free Culture,‖
Nieman Journalism Lab, 23 de mayo 2012,
http://www.niemanlab.org/2012/05/how-la-nacion-is-using-data-to-challenge-a-foia-
free-culture/ (acceso 3 de febrero de 2015).
cxciv
―Argentina‘s Official Advertising Funds Distribution 2009–2013: Friends,
Politicians, and a Stylist,‖ La Nación, 4 de abr. de 2014,
http://blogs.lanacion.com.ar/projects/data/argentina%C2%B4s-official-advertising-
funds-distribution-2009-2013-friends-politicians-and-a-stylist/ (acces3 de febrero
de 2015).
cxcv
―Public Officials Salaries and Assets for Reporting and Accountability,‖ La
Nación, 4 de abr. de 2014, http://blogs.lanacion.com.ar/projects/data/statements-
of-assets/ (acceso 3 de febrero de 2015).
cxcvi
―Monitoring the New Media Law in Argentina 2009–2013,‖ La Nación, 4 de abr.
de 2014, http://blogs.lanacion.com.ar/projects/data/dja-afsca/ (acceso 3 de febrero
de 2015).
cxcvii
―VozData: Collaborating to Free Data from PDFs—The Senate Expenses Part
II,‖ La Nación, 4 de abr. de 2014,
http://blogs.lanacion.com.ar/projects/data/vozdata/ (acceso 3 de febrero de 2015).
cxcviii
―2013 Legislative Elections in Argentina,‖ La Nación, 3 de mzo. de 2014,
http://blogs.lanacion.com.ar/projects/data/2013-legislative-elections-in-argentina/
(acceso 3 de febrero de 2015).
cxcix
―Argentina‘s Senate Expenses 2004–2013,‖ La Nación, 4 de mzo. de 2014,
http://blogs.lanacion.com.ar/ddj/data-driven-investigative-journalism/argentina-
senate-expenses/ (acceso 3 de febrero de 2015).
cc
T. Turner, ―Argentina Imposes Ad Ban, Businesses Say,‖ Wall Street Journal, 8
de febr. de 2013,
http://online.wsj.com/news/articles/SB100014241278873249060045782924337484
98360 (acceso 3 de febrero de 2015).
cci
G. Romero, ―I dati sulla sicurezza sismica delle scuole,‖ Wired Italy, 9 de nov. de
2012, http://daily.wired.it/news/politica/2012/11/09/scuole-sicurezza-terremoto-
143678.html (acceso 3 de febrero de 2015).
ccii
E. Tola, ―Terremoto: la tua scuola è a rischio?‖ Wired Italy, 17 de sep. de 2012,
http://daily.wired.it/news/politica/2012/09/17/terremoto-scuola-rischio.html (acceso
3 de febrero de 2015).
cciii
―La tua scuola è sicura? Cercala sulla mappa,‖ Wired Italy, 9 de nov. de 2012,
http://daily.wired.it/news/politica/2012/11/09/scuolesicure-mappa-scuole-sicurezza-
terremoto-143678.html (acceso 3 de febrero de 2015).
cciv
Government of Italy, http://www.dati.gov.it/ (acceso 3 de febrero de 2015).
ccv
―ForumPA: Il premio Apps4Italy intitolato a Melissa Bassi e alle vittime
dell'attentato di Brindisi | Saperi PA,‖ ForumPA: Il premio Apps4Italy intitolato a
Melissa Bassi e alle vittime dell'attentato di Brindisi | Saperi PA,
http://saperi.forumpa.it/story/74770/forumpa-il-premio-apps4italy-intitolato-melissa-
bassi-e-alle-vittime-dell-attentato-di (acceso 3 de febrero de 2015).
ccvi
G. Romero, ―Di Costanzo, Miur: ‗Rivelare le scuole a rischio sismico è
pericoloso,‖ Wired Italy, 23 de oct. de 2012,
http://daily.wired.it/news/politica/2012/10/23/scuolesicure-anagrafi-scolastiche-
123456.html (acceso 3 de febrero de 2015).
ccvii
A. Howard, ―As Digital Disruption Comes to Africa, Investing in Data Journalism
Takes on New Importance,‖ Radar, O‘Reilly Media, 29 de nov. de 2012,
http://radar.oreilly.com/2012/11/justin-arenstein-africa-data-journalism.html
(acceso 3 de febrero de 2015).
ccviii
―The Challenges Facing Data Journalism in West Africa · Global Voices,‖
Global Voices, 27 de mzo. de 2014, http://globalvoicesonline.org/2014/03/27/the-
challenges-facing-data-journalism-in-west-africa/ (acceso 3 de febrero de 2015).
ccix
J. Arenstein, ―Data Journalism Boosts Voter Registration in Kenya,‖
International Center for Journalists, 24 de nov. de 2012,
http://www.icfj.org/blogs/data-journalism-boosts-voter-registration-kenya (acceso
3 de febrero de 2015).
ccx
P. Butler, ―Data ‗Boot Camp‘ Helps Kenyan Reporter Expose School Sanitation
Woes,‖ International Center for Journalists, 6 de dic.de 2012,
http://www.icfj.org/news/data-%E2%80%9Cboot-camp%E2%80%9D-helps-
kenyan-reporter-expose-school-sanitation-woes (acceso 3 de febrero de 2015).
VI Herramientas del Oficio
Tal como sucede con los oficios, las artes y las ciencias, los periodistas de datos
eligen sus herramientas de acuerdo a las necesidades de un determinado
proyecto, los recursos disponibles, sus conocimientos, su capacitación y el tiempo
disponible. Estas herramientas pueden dividirse en cinco categorías generales:
recolección de datos, depuración, análisis, presentación y publicación.
Depurar los datos ―es a menudo la parte que más tiempo insume en el proceso de
periodismo de datos‖ dijo Jonathan Stray, instructor de la Columbia Journalism
School, quien ha destacado el problema generalizado de que los gobiernos
publiquen los datos encerrados en el Portable Document Format (PDF, Formato
de Documento Portátil) y las medidas heroicas que se necesitan para enfrentar
ese desafío.cclxvi
Pero una parte crucial de lo que se requiere para practicar el periodismo de datos
tiene poco que ver con herramientas y tecnología, y mucho, con tener una
perspectiva y pensamiento crítico. ―Se necesita tener una disposición mental
adecuada para poner esto en el contexto de la historia y descubrir historias, así
como contar con ideas creativas e interesantes para obtener este tipo de material
para tus propias historias‖ dijo Emily Bell. ―No se trata de una función de
procesamiento meramente pasivo, si uno es periodista de datos: es un proceso
activo de hablar, escudriñar y descubrir. Creo que eso es algo que está al alcance
de todos los periodistas‖.
Si uno analiza el periodismo de datos y su cuadro general, las tecnologías más
recientes son parte de una continuidad de narraciones de historias apoyadas en la
tecnología, y con antecedentes desde hace décadas.cclxvii El conjunto canónico de
herramientas para el periodismo asistido por computadora funcionaba en
computadoras de escritorio y servidores, hojas de cálculos, bases de datos,
editores de texto y programas de estadísticas.
La hoja de cálculo fue la primer ―arma mortal‖ en términos de aplicaciones para el
periodismo de datos, así como VisiCalc fue la primer arma mortal para la
computadora Appĺe. En muchos sentidos lo sigue siendo, aunque las hojas de
cálculo funcionen ahora en la red. El trabajo de Chris Amico y Laura Norton Amico
en Homicide Watch (Monitor de Homicidios) comenzó como una hoja de cálculo y
se expandió con el paso del tiempo. ―No importa lo avanzadas que se vuelvan
nuestras herramientas, siempre me encuentro volviendo a Excel inicialmente para
hacer trabajo simple‖, dijo Minkoff, un periodista de datos de Associated Press.
―Nos permite lograr el manejo general de un conjunto de datos‖.
Después de las hojas de cálculo, la segunda herramienta más común aplicada en
este campo es el software de bases de datos, en particular Microsoft Access,
MySQL, PostgreSQL, o SQLite. Un editor de textos, como TextMate o BBEdit y
software de estadísticas como SPSS Statistics redondean el conjunto básico de
herramientas que han sido utilizadas por el PAC desde hace muchos años.
Hoy los periodistas de datos aprovechan las herramientas con asiento en la red
para la recolección, manipulación, el análisis y la creación de visualizaciones de
datos, como Open Refine, Google Fusion Tables, y Tableau. También están
trabajando con lenguajes de programación modernos, como Python, Ruby, y
Javascript, así como d3, una biblioteca Javascript.
―Nos encantan las herramientas que no necesitan de un programador cada vez
que necesitamos crear contenido interactivo‖ dijo Momi Peralta. ―Estas son
herramientas para usuarios finales. Google Docs, hojas de cálculo, Open Refine,
la plataforma de datos abiertos de Junar, Tableau Public para gráficos interactivos
y ahora Javascript o D3.js para gráficos interactivos reutilizables unidos a
conjuntos de datos actualizados‖.
Boyer cree que las tendencias hacia los grandes datos en los medios son claros y
que él y otros periodistas hackers pueden ayudar a sus colegas no sólo a
entenderlos, sino a progresar. ―Hay mucho más, dado que el Estado está
difundiendo sus informaciones más rápidamente‖, dijo en 2012. ―Esta ciudad de
Chicago está difundiendo bastante. Vamos hacia una mayor eficiencia para ayudar
a la gente a trabajar más rápido y escribir mejores artículos. Toda organización de
noticias importante en el país está contratando ahora un programador de
aplicaciones noticiosas, o dos. Para las organizaciones de noticias más pequeñas
realmente funciona. Sus aplicaciones de datos son las que atraen el mayor
tráfico‖. Una vez que tales bases de datos están funcionando, los periodistas
aplican herramientas analíticas para producir informes basados en evidencias.
La dificultad que tuvo ProPubica con el desarrollo del proyecto ―Dollars for Docs‖
pone en perspectiva la escala de ese trabajo, de la conversión de PDF en datos
sucios, hasta las correlaciones para verificar información dentro de las bases de
datos masivas.cclxxvi Los que quieran seguir sus paso debieran leer la guía para
extraer datoscclxxvii de Dan Nguyen, la guía de estilo para aplicaciones
noticiosascclxxviii de Scott Klein y la exploración de ―cómo se hace la salchicha de
datos‖cclxxix de Jacob Harris.
A medida que los periodistas comienzan a trabajar más con los datos, tienen
mayores opciones de herramientas que nunca. También hay poderosos recursos
de software nuevos para periodismo de datos online, desde herramientas de
análisis hasta las de visualizaciones. Como destacó Eric Newton de la Knight
Foundation, muchas de estas nuevas herramientas ayudan a los periodistas a
recoger, depurar, analizar y publicar datos y su uso no requiere un sofisticado
conocimiento de programación.cclxxx
Las herramientas de código abierto también son populares. Como escribió el año
pasado Dan Sinker, jefe de la Asociación Knight-Mozilla Open News Technology
en representación de Mozilla, los perio-programadores ahora están llevando la
programación social ―a un nuevo nivel‖.cclxxxi Así como el software cívicocclxxxi está
cada vez más incorporado al funcionamiento del Estado, el código abierto está
cumpliendo un rol central en la práctica del periodismo de datos.cclxxxiii Mientras
muchos programadores de noticias son agnósticos respecto de las herramientas
que usan para hacer un trabajo, la gente que crea y comparte herramientas de
periodismo de datos a menudo lo hace con código abierto.
Si bien parte de ese desarrollo de código abierto fue impulsado por los
requerimientos del Knight News Challenge, que financió los proyectos PANDA y
Overview, hay un espíritu de colaboración más amplio, evidenciado en la
comunicación intersticial en Twitter, GitHub y listas de correo que conectan la
comunidad de periodismo basado en datos de todo el mundo.
Miembros de redacciones que compiten por las noticias trabajan juntos en la
programación. Por ejemplo, programadores del New York Times y el Washington
Post están uniéndosecclxxxiv para crear una base de datos abierta para las
elecciones.cclxxxv Periodistas de datos de WNYC, el Chicago Tribune y el
Spokesman-Review están colaborando en la creación de una mejor interfase para
datos del Censo.cclxxxvi Los mismos tipos de redes de pares que ayudaron a
construir Internet están construyendo una infraestructura cívica.cclxxxvii
Más allá de sus aportes a la tarea común de la redacción,cclxxxviii este es un grupo
de gente que descubrí que está totalmente decidida a ―mostrar su trabajo‖. Para
los periodistas de datos, eso significa compartir los datos, la metodología y el
código, no sólo las anotaciones. Dicho de otro modo ―no cuente, muestre el
código‖.cclxxxix
calve
J. Merrill, ―Heart of Nerd Darkness: Why Updating Dollars for Docs Was So
Difficult,‖ Republican, 25 de mzo.de 2013,
http://www.propublica.org/nerds/item/heart-of-nerd-darkness-why-dollars-for-docs-
was-so-difficult (acceso 4 de febrero de 2015).
cclxvii
A. DeBarros, ―Data Journalism and the Big Picture,‖ 26 de nov. de 2010,
http://www.anthonydebarros.com/2010/11/26/data-journalism-the-big-picture/
(acceso 4 de febrero de 2015).
cclxviii
S. Lohr, ―The Age of Big Data,‖ New York Times, 12 de febr. de 2012,
http://www.nytimes.com/2012/02/12/sunday-review/big-datas-impact-in-the-
world.html?pagewanted=all (acceso 4 de febrero de 2015).
cclxix
J. Webb, ―Before You Interrogate Data, You Must Tame it,‖ Strata Blog,
O'Reilly Media, 2 de febr.. de 2011, http://strata.oreilly.com/2011/03/simon-rogers-
guardian-wikileaks.html (acceso 4 de febrero de 2015).
cclxx
S. Myers, ―Knight News Challenge Gives $1.5 Million to Projects that Filter,
Examine Data,‖ Poynter, 22 junio de 2011, http://www.poynter.org/latest-news/top-
stories/136661/knight-news-challenge-gives-1-5-million-to-projects-that-filter-
examine-data/ (acceso 4 de febrero de 2015).
cclxxi
―Data Journalism Makes Your Newsroom Smarter…‖ PANDA Project,
http://pandaproject.net/ (acceso 4 de febrero de 2015).
cclxxii
J. Ellis, ―The News Challenge-winning PANDA Project Aims to Make Research
Easier in the Newsroom,‖ Nieman Journalism Lab, 22 junio de 2011,
http://www.niemanlab.org/2011/06/the-news-challenge-winning-panda-project-
aims-to-make-research-easier-in-the-newsroom/ (acceso 4 de febrero de 2015).
cclxxiii
―The Overview Project,‖ Associated Press, http://overview.ap.org/ (acceso 4
de febrero de 2015).
cclxxiv
―The Editorial Search Engine,‖ Jonathan Stray, 26 de febr.. de 2011,
http://jonathanstray.com/the-editorial-search-engine (acceso 4 de febrero de
2015).
cclxxv
J. Stray, ―How a Computer Can Organize Thousands of Documents for a
Reporter,‖ PBS Idea Lab, 23 de abr.de 2013,
http://www.pbs.org/idealab/2013/04/how-a-computer-can-organize-thousands-of-
documents-for-a-reporter110 (acceso 4 de febrero de 2015).
cclxxvi
J. Merrill, 25 de febr.. de 2013.
cclxxvii
D. Nguyen, ―Scraping for Journalism: A Guide for Collecting Data,‖
ProPublica, 30 de dic. de 2010, http://www.propublica.org/nerds/item/doc-dollars-
guides-collecting-the-data (acceso 4 de febrero de 2015).
cclxxviii
S. Klein, ―ProPublica News Apps Style Guide,‖ GitHub,
https://github.com/propublica/guides/blob/master/news-apps.md (acceso 4 de
febrero de 2015).
cclxxix
J. Harris, ―How the Data Sausage Gets Made,‖ Source, OpenNews,
https://source.opennews.org/en-US/learning/how-sausage-gets-made/ (acceso 4
de febrero de 2015).
cclxxx
E. Newton, ―New Digital Tools for Journalists: 10 to Learn,‖ Knight Foundation
Blog, 2 de febr. de 2013,
http://www.knightfoundation.org/blogs/knightblog/2013/2/4/new-digital-tools-
journalists-10-learn/ (acceso 4 de febrero de 2015).
cclxxxi
D. Sinker, ―Journo-Coders Take NICAR 12 to a Whole New Level,‖ PBS Idea
Lab, 29 de febr. de 2012, http://www.pbs.org/idealab/2012/02/journo-coders-take-
nicar-12-to-a-whole-new-level059 (acceso 4 de febrero de 2015).
cclxxxii
Civic Apps, Code for America,http://www.codeforamerica.org/apps/ (acceso
4 de febrero de 2015).
cclxxxiii
M. Sill, ―The Case for Open Journalism Now,‖ USC Annenberg School for
Communication & Journalism, dic. de 2011,
http://www.annenberginnovationlab.org/OpenJournalism/overview (acceso 4 de
febrero de 2015).
cclxxxiv
A. LaFrance, ―New York Times, Washington Post Developers Team up to
Create Open Elections Database,‖ Nieman Journalism Lab, 26 de sep. de 2012,
http://www.niemanlab.org/2012/09/new-york-times-washington-post-developers-
team-up-to-create-open-elections-database/ (acceso 4 de febrero de 2015).
cclxxxv
A. Howard, ―Knight Winners are Putting Data to Work: Open Elections,‖ 22 de
sep. de 2012, http://radar.oreilly.com/2012/09/knight-news-challenge-data-
winners.html#openelections (acceso 4 de febrero de 2015).
cclxxxvi
A. Howard, ―Knight Winners are Putting Data to Work: Census IRE,‖ 22 de
sep. de 2012, http://radar.oreilly.com/2012/09/knight-news-challenge-data-
winners.html#censusIRE (acceso 4 de febrero de 2015).
cclxxxvii
S. Johnson, ―Peer Power, from Potholes to Patents,‖ Wall Street Journal,
http://online.wsj.com/news/articles/SB100008723963904441658045780085114937
89642 (acceso 4 de febrero de 2015).
cclxxxviii
A. Howard, ―Data Journalism, Data Tools, and the Newsroom Stack,‖ Radar,
O‘Reilly Media, 5 de jul. de 2011, http://strata.oreilly.com/2011/07/data-journalism-
tools-newsroom-stack.html (acceso 4 de febrero de 2015).
cclxxxix
D. Nguyen, ―Code, Don‘t Tell: Programming as an Essential Journalism Skill,‖
danwin.com, 22 de febr. de 2012. http://danwin.com/2012/02/code-dont-tell-
programming-as-an-essential-journalism-skill/ (acceso 4 de febrero de 2015).
VII. Gobierno Abierto
Las ventajas que han obtenido ciudades como New York al adoptar una estrategia
de base ya no son teóricas. La divulgación pública de datos abiertos del gobierno
se vuelve una infraestructura crítica al producirse desastres naturales.ccxcvi En New
York City, los sitios en la red de la municipalidad tuvieron fuerte demanda, cuando
los residentes acudieron a su buscador de rutas de evacuación en caso de
huracanes, en momentos que se preveía la llegada del Huracán Sandy. La gente
también podía consultar el mapa de evacuación de WYNC, adecuado para
dispositivos móviles.
El editor de periodismo de datos de WNYC, John Keefe, fue responsable del mapa
que permitió aprovechar los datos de gobierno abierto de la municipalidad. ccxcvii
[Mapa de Evacuación de WNYC]
b. Datos y Ética
En los últimos años más administraciones municipales, provinciales y nacionales
han comenzado a difundir proactivamente datos del sector público con la
esperanza de estimular efectos económicos, mejorar los servicios, o aumentar la
transparencia y la rendición de cuentas. Cuando estos conjuntos de datos que
detallan el desempeño, el gasto, el presupuesto o los servicios, no incluyen
deliberaciones o decisiones en materia política -es decir, acerca de cómo se
ejerce el poder o la influencia- los periodistas deben seguir buscando, extrayendo
e investigando.
Hay buenos motivos para que los periodistas sean cuidadosos respecto de una
aceptación completa de los datos abiertos del Estado, al menos con respecto a la
relación entre los datos y la transparencia del gobierno. Ahora hay una
considerable ambigüedad respecto del gobierno abierto, como exploró un trabajo
de 2012, ―The New Ambiguity of 'Open Government'‖ (―La Nueva Ambigüedad del
'Gobierno Abierto'‖) de los investigadores de Princeton David Robinson y Harlan
Yu. Su resumen inicial dice:
Las tecnologías abiertas incluyen compartir datos por internet y los gobiernos
pueden usarlas por todo tipo de razones. Las políticas públicas más
recientes han expandido el significado de ―gobierno abierto ― para abarcar
cualquier uso de estas tecnologías por el sector público. Así, ―datos de
gobierno abierto‖ podría referir a datos que hacen más abierto al Estado de
conjunto (es decir, más transparente), pero igualmente podría referir a
informes del sector público políticamente neutrales que son fáciles de
reutilizar, pero también, pueden no tener nada que ver con la rendición de
cuentas pública del gobierno. Hoy un régimen puede llamarse ―abierto‖ si
crea el tipo adecuado de sitio en la red, aunque el mismo no implique
rendición de cuentas ni su transparencia. Este cambio de vocabulario hace
más difícil para los funcionarios y activistas articular prioridades claras y
hacer demandas convincentes.ccxcix
Como saben los periodistas de datos escépticos, hay una diferencia entre los
datos abiertos ofrecidos proactivamente por el gobierno y datos enterrados en
PDF difundidos en respuesta a demandas basadas en la Ley de Acceso a la
Información Pública o demandas legales de compañías de medios y activistas.
Dicho esto, hay mucho por ganar con instalar una gran carpa por el gobierno
abierto, como sostuvieron Joshua Goldstein y Jeremy Weinstein en una respuesta
a Yu y Robinson en el UCLA Law Review (Revista de Derecho de la universidad
de California en Los Ángeles) incluyendo beneficios para los periodistas de datos.
Escribieron:
Dijo Peralta:
―La difusión pública de datos oficiales significa que más gente puede acceder a y
reutilizar la información publicada por entes estatales‖, dijo Bounegru. ―Esto no
basta. Es cada vez más importante que los periodistas puedan mantenerse
actualizados y tenga las capacidades y los recursos para comprender los datos
que publica el gobierno. Los periodistas tienen que saber lo que significan los
datos oficiales, lo que dicen y lo que dejan de decir‖.
Eso requiere que los periodistas posean conocimientos matemáticos y digitales
para poder interrogar a los datos. ―Sólo equipando a los periodistas con las
capacidades para usar los datos de modo más efectivo podemos terminar con la
actual asimetría, donde nuestra comprensión de la información importante se ve
mediada por el Estado, las compañías y otros expertos‖ dijo Bounegru. ―Dicho
sintéticamente, los partidarios de los datos abiertos reclaman más datos y los
periodistas de datos ayudan al púbico a usarlos, explorarlos y evaluarlos‖.
Los datos abiertos necesitan llegar a la gente, no a la inversa. Para que eso
suceda, una parte fundamental de la ecuación es apoyar y extender la capacidad
de los medios para practicar el periodismo basado en datos. El rol que cumple el
cuarto poder en hacer que los gobiernos rindan cuentas en el siglo XXI no es
menos acuciante que en décadas pasadas. En todo caso lo es más, dado el modo
en que se concentra y ejerce el poder en secreto en todo el mundo.
Hay una larga historia de funcionarios electos o personal estatal que quiere evitar
que llegue a la atención del púbico información que muestra la existencia de
fraudes, influencias indebidas, conductas vergonzosas o directamente crímenes.
Eso sigue siendo cierto hoy. Para preservar las evidencias, los periodistas de
datos también necesitarán proteger los datos, así como los editores históricamente
han protegido las fuentes humanas. Cuando se une el trabajo de investigación con
el periodismo de datos, florecen resultados extraordinarios.
―Tomamos informes narrativos de inspecciones a geriátricos e hicimos que se
pudiera buscar información en elloscccvi por medio de palabras claves, cosa que el
gobierno no facilita‖, dijo Ornstein, un importante reportero de ProPublica. La
herramienta resultante, que permite a la gente buscar geriátricos online, cccvii es una
versión del siglo XXI de periodismo de servicio que al mismo tiempo ofrece a la
gente un modo de tomar decisiones mejor informadas, y agrega un mecanismo de
control de las empresas y del Estado.
En ProPublica el equipo de periodismo de datos es consciente de la profunda
vinculación de las aplicaciones de noticias con la idea de que las visualizaciones
producidas con tales aplicaciones son en sí mismas una forma de periodismo
narrativo. Con las grandes visualizaciones de datos, los lectores pueden orientarse
e interrogar a los datos por sí mismos. Lo que es más, la diferencia entre un
artículo noticioso y una aplicación de noticias se están disolviendo al acceder cada
vez más los lectores a los medios a través de dispositivos móviles y tabletas.
Un enfoque que ofrece una útil visión en contexto es el formato ―Ojo sobre [x]‖ en
ProPublica.org donde un proyecto como ―Eye on the Stimulus‖cccviii es un híbrido
entre un blog y una aplicación. En un costado de la página web hay un flujo de
noticias. En el otro hay puntos de ingreso a los datos mismos. El desafío para este
enfoque es que el medio necesitará de especialistas en datos para que trabajen
en estrecha colaboración con los investigadores o que las mismas personas sean
las dos cosas.
Aunque eso sea así, no importa cuál sea el contexto, el aumento de la capacidad
de procesar datos necesariamente partirá de distintos niveles en distintas culturas
y climas de los medios. ―El periodismo de investigación en África, al igual que en
muchos otros lugares, tiende a ser impulsado por el interés en obtener primicias.
Significa que alguien le ha filtrado a uno un conjunto de documentos‖, dijo Justin
Arenstein, un becario de Knight International instalado en la African Media Initiative
(AMI, Iniciativa de Medios Africana)cccix como director de innovación digital.
Hay muy pocos enfoques sistemáticos, analíticos para analizar tendencias amplias
en la sociedad‖, dijo. ―Aún hay mucho periodismo de ocasión. Eso no ayuda a
analizar las sociedades en las que estamos, y lo que es más importante no nos
ayuda a crear herramientas para tomar decisiones‖.
La estrategia que Arenstein y la AMI llevan adelante diverge de las aplicaciones de
noticias y las visualizaciones de datos que son los resultados comunes del
periodismo de datos en Europa y Estados Unidos. No solo narran una historia sino
que dan a la gente una herramienta para entender un área específica, tomar
decisiones y actuar. Arenstein subrayó la necesidad de pensar en profundidad
acerca de cómo usan los periodistas los datos en las investigaciones, en oposición
al uso de material en crudo para una visualización. Los vínculos más fuertes entre
el trabajo que realiza Code en Kenya y ProPublica en Estados Unidos, de hecho,
están en su uso de los datos para apoyar y aumentar el trabajo de investigación,
mapeando las relaciones de los poderosos y financiando proyectos sobre
industrias extractivas.
―Nosotros estamos encontrando algo que quizás ustedes también estén
empezando a ver indicios en otras partes: el periodismo de datos no tiene
necesariamente que ser el producto‖, dijo. ―El periodismo de datos también puede
ser el camino que uno sigue para llegar a una historia final. No tiene
necesariamente que producir una infografía o un mapa‖.
La cuestión del daño potencial del periodismo de datos apareció cuando Wikileaks
difundió datos de los departamentos de Defensa y de Estado de Estados Unidos a
múltiples organizaciones de noticias en 2010 y 2011. Cada organización de
medios que estudió los cables o registros secretos del Pentágono y el
Departamento de Estado tuvo que decidir no solo si publicarlos, además, cómo
hacerlo balanceando la difusión de nombres de personas que podían quedar en
riesgo con el derecho del público a conocer lo que el gobierno había hecho en su
nombre.
Pero solo un número limitado de organizaciones de noticias tienen la capacidad
técnica de analizar millones de líneas de datos impuros en formatos específicos.
Si no se democratiza la capacidad de hacer periodismo de datos a gran escala,
esta dinámica podría consagrar las estructuras tradicionales del poder de los
medios.
―Yo ayudé con los registros de guerra de Wikileaks‖ dijo Jacob Harris, periodista
de datos del New York Times. ―Creamos una aplicación interna para que los
reporteros buscaran en los informes, los vieran en un mapa y marcaran los más
interesantes. Una de las cosas más singulares que resolví fue como extraer
coordenadas MGRS [Military Grid References System] (Sistema de Referencias
de Grillas Militares) de los informes para codificar geográficamente las locaciones
a las que hacían referencia. A partir de esto pude distinguir la ubicación de varios
homicidios dentro de Bagdad con mayor precisión que lo que permitía la
codificación geográfica de los propios informes. Creé un demo, lo presenté con
gráficos y creamos una visión efectiva y aleccionadora de la devastación de
Bagdad por la violencia.cccxx
cccviii
―Eye on the Stimulus,‖ ProPublica, http://www.propublica.org/ion/stimulus
(acceso 4 de febrero de 2015).
cccix
African Media Initiative, http://africanmediainitiative.org/ (acceso 4 de febrero
de 2015)
cccx
K. Culver, ―Where the Journal News Went Wrong in Mapping Gun Owners,‖
PBS MediaShift, 2 de febr. de 2013, http://www.pbs.org/mediashift/2013/02/where-
the-journal-news-went-wrong-in-mapping-gun-owners053 (acceso 4 de febrero de
2015).
cccxi
―Map: Where are the Gun Permits in Your Neighborhood?‖ The Journal News,
23 de dic.de 2012,
http://archive.lohud.com/interactive/article/20121223/NEWS01/121221011/Map-
Where-gun-permits-yourneighborhood (acceso 4 de febrero de 2015).
cccxii
D. Carr, ―Guns, Maps and Data That Disturb,‖ New York Times, 14 de en. de
2013, http://www.nytimes.com/2013/01/14/business/media/guns-maps-and-
disturbing-data.html (acceso 4 de febrero de 2015).
cccxiii
S. Roudman, ―When it Comes to Disclosure, New NY Gun Control Law is
Shooting a Blank, ‖TechPresident, 16 de en. de 2013,
http://techpresident.com/news/23382/new-gun-control-law-foils-foia (acceso 4 de
febrero de 2015).
cccxiv
N. Judd, ―The Guns and Gun Data Debate, Or, How I Learned to Stop
Worrying And Love the End of Privacy,‖ TechPresident, 11 de en. de 2013,
http://techpresident.com/news/23360/guns-or-how-i-learnedstop-worrying-and-
love-end-privacy (acceso 4 de febrero de 2015).
cccxv
L. Incalcaterra, ―Many Handgun Permits in N.Y. County Have Outdated Data,‖
USA Today, 27 de en. de 2013,
http://www.usatoday.com/story/news/nation/2013/01/27/outdated-new-york-gun-
permitdata/1868787/ (acceso 4 de febrero de 2015).
cccxvi
J. Goodman, ―Newspaper Takes Down Map of Gun Permit Holders,‖ New
York Times, 19 de en. de 2013,
http://www.nytimes.com/2013/01/19/nyregion/newspaper-takes-down-map-of-gun-
permit-holders.html (acceso 4 de febrero de 2015).
cccxvii
A. Tompkins, ―Where the Journal News Went Wrong in Publishing Names,
Addresses of Gun Owners,‖ Poynter, 7 de en. de 2013,
http://www.poynter.org/latest-news/als-morning-meeting/199218/wherethe-journal-
news-went-wrong-in-publishing-names-addresses-of-gun-owners/ (acceso 4 de
febrero de 2015).
cccxviii
J. Sonderman, ―Programmers Explain How to Turn Data into Journalism &
Why That Matters, ‖Poynter, 13 de en. de 2013, http://www.poynter.org/how-
tos/digital-strategies/199834/programmers-explainhow-to-turn-data-into-journalism-
why-that-matters-after-gun-permit-data-publishing/ (acceso 4 de febrero de 2015).
cccxix
Ibid.
cccxx
J. Harris, et al., ―A Deadly Day In Baghdad,‖ New York Times, 24 de oct. de
2010, http://www.nytimes.com/interactive/2010/10/24/world/1024-surge-
graphic.html (acceso 4 de febrero de 2015).
cccxxi
C. Andersen, E. Bell, and C. Shirky, 27 de nov. de 2012.
VIII Sobre el Futuro
Recomendaciones y Predicciones
El mundo necesita más que nunca periodistas con estas capacidades. Las mismas
tendencias que están cambiando el periodismo y la sociedadcccxxii tienen el
potencial de crear cambios sociales significativos en todo el mundo, al avanzar los
Estados nacionales de una situación de escasez a una de abundancia de
información, causando grandes perturbaciones a los gobiernos y a la capacidad de
gobernar.
Los periodistas siempre necesitaron escribir, entrevistar y contrastar su trabajo con
los hechos. Hoy la fotografía, los medios sociales, la edición de video y los
dispositivos móviles se han convertido en elementos que son parte del
herramental de muchos periodistas. Ya sea que los productores de noticias se
dediquen a presentar datos en tiempo real,ccxxiii a validar datos en el mundo
real,ccxxiv o a mejorar la cobertura de las noticias con datos,ccxxv el buen periodismo
de datos sigue teniendo que narrar una historia, resolver un problema o decirle la
verdad al poder. Los teléfonos inteligentes, las notebooks, las cámaras, los medios
sociales y los conjuntos de datos pueden ampliar las investigaciones de manera
importantes.
En el futuro inmediato hay que prever que las capacidades básicas de la ciencia
de los datos serán una de las formas en que los periodistas obtienen fuentes,
encuentran evidencias y presentan sus conclusiones; desde armar bases de
datos, pasando por la creación de visualizaciones, hasta la aplicación de
poderosos softwares analíticos. Junto con esas capacidades, los periodistas
seguirán necesitando aplicar el pensamiento crítico y mostrar cómo llegaron a sus
conclusiones.
Si bien la necesidad es aguda y las escuelas de periodismo están respondiendo,
sigue habiendo barreras culturales, fiscales y técnicas en la adopción del
periodismo de datos y las capacidades digitales. En mayo de 2014 un nuevo
informeccxxvi del Duke Reporters' Lab (Laboratorio de Reporteros Duke) en el
DeWitt Wallace Center for Media and Democracy (Centro para Medios y
Democracia) en la Sanford School of Public Policy (Escuela Sanford de Políticas
Públicas) encuestó a 20 departamentos de noticias para saber qué herramientas
digitales aún faltan. Las principales conclusiones de Mark Stencel, Bill Adair y
Prashanth Kamalakanthan pintan un cuadro de una industria en flujo que obliga a
reflexionar.
El informe concluyó que muchas redacciones en EE.UU. no están aprovechando
las nuevas herramientas digitales de bajo costo para el periodismo y su
presentación, continuando en cambio con el uso de métodos y prácticas
familiares. Los autores sugieren que los premios al periodismo y las conferencias
de medios populares han creado la percepción de que la adopción de
herramientas digitales y el periodismo de datos ha avanzado más de lo que en
realidad ha sucedido.
Mientras los líderes de los departamentos de noticias de medios locales dijeron a
los investigadores que la falta de presupuesto, de tiempo y de personal son sus
principales limitaciones, problemas de infraestructura y culturales más profundos
están impidiendo la adopción de los mismos. El informe describe una industria con
una brecha entre ―los poseedores y los desposeídos‖, con las organizaciones
nacionales experimentando con el periodismo de datos y las nuevas herramientas
digitales, mientras las redacciones de noticias locales no lo hacen.
―Los departamentos de noticias de medios locales que han hecho un uso
inteligente de las herramientas digitales cuentan con líderes que están dispuestos
a tomar decisiones difíciles respecto de qué sacrificar en su cobertura‖ escriben
los autores. Priorizan historias que revelan el significado y las implicancias de
noticias por encima de una abrumadora concentración en la búsqueda de
desarrollos incrementales. También piensan en el trabajo que pueden hacer con
herramientas digitales como maneras de narrar historias que no se han contado,
no como forma de 'agregar adornos'‖ escribieron los autores.
El tercer informe, sobre innovación del New York Times,cccxxviii fue preparado por
un equipo del diario para uso interno, no para consumo del público. Luego de que
el documento se filtrara online en mayo de 2014 a través de Buzzfeed y Mashable,
sin embargo, fue celebrado por Joshua Benton, el director del Nieman Journalism
Lab de Harvard, como ―uno de los documentos claves de esta era de los
medios.‖cccxxix
Hay una cantidad tremenda de clarificaciones e introspección en el informe de 97
páginas que analizó el panorama actual de los medios en profundidad, basándose
en entrevistas a docenas de empleados del New York Times y docenas más de
observadores externos, incluyendo este autor. Hablé con un investigador del
equipo del Times el año pasado acerca del enfoque que tiene el diario del
periodismo digital, la analítica editorial, los medios sociales y los datos, junto con
mis propios hábitos de lectura, intercambio y comentario.
El informe describe un cuadro de una organización extraordinaria dentro de una
institución y un negocio que enfrenta los mismos cambios fundamentales que
soporta la sociedad en general en el siglo XXI. Por momentos se debate para
escapar a un legado del siglo XX de herramientas, infraestructura y cultura.
Aunque el público digital del New York Times es mayor que su número de lectores
de la edición impresa (31 millones de visitantes individuales por mes a
nytimes.com versus 1.6 millones de circulación diaria total), el trabajo editorial
diario descripto sigue concentrado en la edición en papel y no en los píxeles.
Una vez que se filtró online, el nuevo editor ejecutivo del New York Times, Dean
Baquet, apoyó, tanto interna como públicamente, el informe y la estrategia de
poner el contenido digital primero. Está por verse si junto con sus colegas podrá
aplicar sus recomendaciones.
Pero las conclusiones de estos tres informes deben llamar a la reflexión de todos
modos. El Times podrá estar bien, pero otros diarios no lo estarán. Los
departamentos de noticias se enfrentan a presupuestos ajustados, desafíos
culturales profundamente enraizados, obligaciones y deudas y una disminución
histórica de la confianza del público en los medios. Por el lado positivo hay
muchos beneficios en adoptar y usar las herramientas actuales y vastos campos
verdes para que los medios que se basan en lo digital experimenten, creen y
encuentren públicos, al acceder online por primera vez miles de millones de
personas a nivel global.
¿Entonces,a qué es lo que debemos estar atentos que suceda a continuación y
dónde? La siguiente lista de recomendaciones y predicciones bosquejan qué
esperar en la próxima década y a qué tendrán que adecuarse los editores.
1) Los datos se volverán un recurso aún más estratégico para los medios.
Si el texto es la próxima frontera en el periodismo de datos,cccxxxiii debiera usarse al
servicio de narrar historias de modo más efectivo, permitiendo al periodismo digital
y las humanidades digitales fusionarse al servicio de una sociedad más
informada.cccxxxiv Las organizaciones de medios modernas deben convertirse en
fuentes de datos confiables.cccxxxv Cantidades crecientes de datos serán
albergados por organizaciones de medios y aprovechados como un activo. En
algunos casos compañías de medios quizá puedan vender acceso a sus archivos
y API.
Dado lo delicado de ciertos conjuntos de datos y la responsabilidad de las
organizaciones noticiosas respecto de las fuentes confidenciales y los
denunciantes, los medios necesitarán mejorar sus prácticas de seguridad.
Recientes incidentes de hackeo en diarios importantes generalizados en todo
Estados Unidos destacan la necesidad de mejoras.cccxxxvi
Aunque los recursos para aprender periodismo de datos mejoran a diario, aún
existe una barrera elevada al ingreso de gente sin experiencia en esta práctica.
Eso está cambiando con las ofertas online de recursos más poderosos. Muchas
de estas herramientas para crear o presentar periodismo basado en datos
provendrán de nuevas firmas u organizaciones sin fines de lucro como CartoDB,
DocumentCloud, Timeline.js, Mapbox,
Frontline SMS, Zeega, Kimono, Enigma.io, Amara, Plot.ly, DataWrapper, y Graf.ly.
Otras herramientas serán provistas por gigantes de la tecnología, como Google,
Amazon y Esri, como servicios gratuitos en la red y de código abierto o con
licencia empresaria y aranceles por el uso de API. La incertidumbre respecto de la
sustentabilidad llevará a fundaciones a financiar herramientas y plataformas,
incluyendo proyectos piloto, emprendimientos empresariales o componentes de
infraestructura cívica de código abierto. El resto de las herramientas serán creadas
por hackers de noticias independientes, estudiantes universitarios y periodistas de
datos, como proyectos apasionantes que apunten a satisfacer anhelos
individuales; estos pueden muy bien terminar ayudando a otras personas a
resolver problemas similares.
Así como editar texto y fotografía o videos se volvió accesible para cientos de
millones de personas, analizar y presentar datos en mapas, aplicaciones y
visualizaciones se volverá más fácil de hacer.
5) Hay que prever que habrá más periodismo robótico, pero las relaciones
humanas y la capacidad humana de narrar historias aún importan
―Filosóficamente creo que el periodismo de datos comparte cosas con las ciencias
sociales y también hay una relación real con las humanidades digitales‖ dijo
Jonathan Stray, que es docente de la carrera en Columbia. ―El énfasis no está
puesto sólo en los algoritmos, sino en qué nos dicen estos algoritmos. ¿Cómo
debemos interpretar todos estos resultados sofisticados?‖
Estas preguntas han sido parte integral de la manera en que los sociólogos,
antropólogos y etnógrafos han conducido sus investigaciones por décadas, en
particular, con respecto a la recolección de datos y las estadísticas. Esto significa
que si miembros de los medios buscan practicar el periodismo de datos, tendrán
que saber matemática, manejar la ética y ser conscientes de cuál es el sentido en
que son sesgados los datos a los que interrogan.
Esta no es una idea nueva, dado hasta qué punto el ―periodismo de precisión‖ de
Philip Meyer se basa en la aplicación de las ciencias sociales al periodismo de
investigación, todo el que quiera practicar y publicar periodismo de datos sólido va
a tener que entenderla.
Los científicos sociales y los biólogos saben que las fuentes de datos y las
condiciones en las que se recolecten moldearán y orientarán las conclusiones de
la investigación basada en ellos. Para atender a públicos amplios, los periodistas
de datos tienen que ir más allá de adquirir y depurar datos, comprendiendo su
origen y su fuente. Entonces tendrán que asegurarse que su presentación no
transmita una historia distinta a la que permiten inferir los datos mismos.
Nada de ello es fácil para gente con formación científica, mucho menos para los
periodistas. Algunos proyectos y análisis pueden exceder la capacidad técnica o el
conocimiento experto sobre un tema de determinados miembros de los medios.
Colaborar con el sector académico y los tecnólogos será preferible a producir un
periodismo, análisis, mapas o visualizaciones fallidos, que orienten mal a los
lectores, dado el impacto que conclusiones imprecisas tendrán sobre la confianza
en los autores o las publicaciones.
Equivocarse con un dato o una cita equivocada puede hundir un informe noticioso,
llevando a una corrección o incluso a retractarse. Equivocarse en un algoritmo o la
interpretación de un dato de modo similar puede echar por tierra la premisa de un
evento de periodismo de datos.
Los errores cometidos en un informe en FiveThirtyEight.com que buscaba hacer el
mapa de secuestros en Nigeria ofrece un estudio de caso ilustrativo.ccxxxix El
informe se basaba en datos obtenidos de la Global Database of Events, Language
and Tone (GDELT, Base de Datos Global de Eventos, Idioma y Tono). Como
reconocía la corrección del informe, lo publicado tenía una falla básica porque el
periodista no advirtió que los datos representaban la tasa de historias en los
medios de comunicación como aproximación a la tasa de secuestros, no tuvo en
consideración los informes duplicados ni que se utilizó una locación por defecto si
no figuraba el lugar del hecho. La descontextualización de los datos de GDELT
condujo a un informe equivocado.cccxl
El periodismo de datos atraerá a lectores con conocimientos matemáticos que no
sólo estarán interesados en los datos en los que se basen los informes y el
análisis utilizado para llegar a las conclusiones, sino también en tratar de
reproducirlos.
Por ejemplo un informe de FiveThirtyEight.com sobre la prueba Bechdel en las
películas fue motivo de un análisis en profundidad de Brendan Keegan, que pudo
replicar las conclusiones. Lo que eso significa en la práctica es que cualquier
compañía de medios que publique este tipo de trabajo debe tener una política de
correcciones vigente para el periodismo de datos.cccxli
Andrew Shitby, economista de Nesta, al encontrar ejemplos de periodismo de
datos malocccxlii propuso cuatro principios para mejorar la forma:
En Estados Unidos, el correo electrónico que pasa por servidores del sector
privado por fuera del control de una compañía de medios no tiene la misma
protección legal que el correo electrónico dentro de una oficina. Hasta que se
reforme la Ley de Privacidad de Comunicaciones Electrónicas, los periodistas
debieran ser más cautos respecto del flujo de correo o datos en otras plataformas.
La gente que practique el periodismo de datos o el hacking cívico tiene que saber
acerca de la Computer Fraud and Abuse Act (CFAA, Ley de fraude y abuso por
computadora),cccxliii junto con las propuestas de reforma de la misma.cccxliv Los
periodistas o miembros del público que tienen dudas sobre la legalidad del acceso
o el uso de datos y no tienen los recursos legales de importantes organizaciones
de medios que los respalden, deben pensarlo dos y tres veces antes de hacer un
clic.
En general los periodistas deben considerar cuándo es apropiado extraer datos,
acceder a datos, almacenarlos... o no. ¿La historia requiere almacenar información
personal? Si es así, tales datos sensibles tendrán que ser protegidos con el mismo
vigor con el que los periodistas han protegido sus fuentes confidenciales.
Desgraciadamente, las prácticas de seguridad con que muchas compañías de
medios manejan la información no son tan sólidas como las que necesitarían para
evitar determinadas intrusiones del crimen organizado o del Estado.
Para más datos sobre seguridad, ética, privacidad y periodismo, consulte el libro
blanco del Tow Center sobre el tema.
10) Sin duda surgirán conflictos por los registros públicos, la extracción de
datos y la ética.
Para bien o para mal, es probable que veamos más mapas y aplicaciones
interactivas controvertidas online que muestren donaciones, votos, aportes,
permisos, condenas y otros registros públicos. Junto con su difusión voluntaria, los
datos serán extraídos, reclamados basándose en las leyes de libre acceso a la
información u obtenidos por otras vías de las publicaciones, los entes y los sitios
en la red oficiales.
Con el paso del tiempo, una parte mucho mayor de estos datos terminará en
manos privadas, junto con los medios, organizaciones sin fines de lucro,
fundaciones, páginas de medios ingeniosos y sarcásticos y colectivos hacker
como Anonymous. Sin duda, algunos de los mapas y cuadros resultarán
incorrectos, producto de la incompetencia o de intención maliciosa, lo que llevará
al errado señalamiento de personas que estarán sujetas a abusos o cosas aún
peores.
A su vez, los gobiernos tratarán de negar el acceso a los datos, con documentos
pesadamente redactados, exigirán eliminar publicaciones y criminalizarán
extracciones o llamadas API. Aplicarán filtrado o censura extra-legal por medio de
presión sobre los procesadores de pagos, incautarán servidores o incluso habrá
negaciones directas de ataques a servicios. Las compañías podrán negar acceso
a sus plataformas para aplicaciones o servicios que utilicen datos controvertidos,
como en el caso en que Apple rechazó una aplicación que mostraba ataques con
drones,cccdlv o incluso acusarán a reporteros de ser hackers si encuentran
violaciones de datos o datos sin protección online.cccxlvi
Alrededor del mundo, los conflictos en sociedades con gobiernos más cerrados y
flujos de información restringidos probablemente sean explosivos. Los datos
abiertos no bastan:cccxlvii El periodismo de investigación seguirá siendo esencial.
En Estados Unidos enfrentaremos cuestiones más difíciles relacionadas con la
Primera y Cuarta Enmienda de la Constitución como resultado de todo esto. Va a
ser extremadamente complicado. Los efectos paralizantes de la vigilancia masiva
sobre el periodismo digital seguirán siendo tema en debate durante años. Así
como las fuentes pueden no confiar en la idea de una conversación privada con un
reportero, el origen de los datos puede resultar difícil de ocultar.
Como destacó un comentario públicocccxlviii de la Escuela de Periodismo de
Columbia y el Centro para Medios Cívicos del MIT al Review Group on Intelligence
and Communication Technologies (Grupo de Revisión sobre Inteligencia y
Tecnologías de Comunicación) convocado por el presidente Barack Obama:
La diversidad ha sido un desafío en los medios por décadas. Si bien muchas más
mujeres y personas integrantes de minorías trabajan en el periodismo profesional
que hace un siglo, un estudio de 2013 de la American Society of News Editors
(ASNE, Sociedad Americana de Editores de Noticias) concluyó que de los 38.000
periodistas que trabajan actualmente en 1400 diarios de EE.UU., 4700 pertenecen
a minorías.cccli Una encuesta de ASNE de organizaciones de noticias online de
2013 concluyó que el 63 por ciento no tiene personas pertenecientes a
minorías.ccclii Las decisiones de contratación de Vox Media, FiveThirtyEight, First
Look Media y otras nuevas firmas noticiosas motivaron críticas en la primavera
boreal de 2014,cccliii incluyendo una carta abierta de la National Association of
Black Journalists, expresando preocupación por la falta de diversidad.cccliv
Las preocupaciones por la diversidad son particularmente relevantes en el espacio
del periodismo de datos, dados los problemas más amplios relacionados con
mujeres en la tecnología que se han vuelto evidentes en los últimos años. Online y
fuera de Internet, la misoginia y la discriminación perduran en la industria, junto
con el sexismo y el racismo más sutiles. El desafío que enfrentan los editores al
contratar un equipo diverso de periodismo de datos es estructural, reflejando
cuestiones sociales más amplias. A 2010, 18 por ciento de los estudiantes no
graduados que aspiraban a un título en ciencias de la computación eran mujeres,
según el National Center for Women & Information Technology (Centro Nacional
para Mujeres & Tecnología Informática).ccclv En 2013, solo el 0,4 por ciento de
todas las estudiantes de college en su primer año dijeron que pensaban tomar
ciencias de la computación como su interés principal.ccclvi Dado el contexto, quizás
no debió ser una sorpresa cuando Nate Sivler dijo que le 85 por ciento de los que
solicitaron empleo en FiveThirtyEight eran hombres.
Pero hay motivos para ser cautamente optimista en el periodismo de datos.
Entrevistas con mujeres y personas pertenecientes a minorías en Estados Unidos
sugieren que las comunidades que han crecido en contacto con el periodismo
asistido por computadora a lo largo de las décadas pueden ser más abiertas a
aceptar rostros diferentes que otros en el mundo tecnológico, quizás debido a la
cultura que se centra más en el aprendizaje entre pares que en la tutoría.
―NICAR es un lugar bastante saludable para personas que no son blancas ni
masculinas que trabajan en el periodismo‖ dijo Tasneem Raja. ―No puedo opinar
sobre cuestiones de clase, capacidad, identidad de género y otros tipos de
diferencias más que para decir que en esas cuestiones somos menos positivos y
eso tiene que cambiar‖.
Y continuó:
No tengo experiencia con la manera en que la gente de esta comunidad
maneja cuestiones de inclusión cuando aparecen, pero he visto evidencias
de gente que trabaja preventivamente para crear ambientes que sean menos
excluyentes de lo que es la norma en la programación para la red, el análisis
cuantitativo, las artes visuales o el periodismo. Quizás eso se deba a que no
ha habido muchos de nosotros en el periodismo de datos en la red hasta
hace poco. Los periodistas de datos son pragmáticos por naturaleza, y
quizás no tiene sentido alienar a franjas potenciales de nuevos reclutas.
Eso no quiere decir que todo sea arco iris y rayos de sol, pero voy a
aprovechar un raro momento de optimismo aquí para decir que estoy
orgullosa de representar a esta comunidad porque, en mi experiencia, está
genuinamente comprometida con la inclusión.
cccxxii
A. Howard, ―Four Key Trends Changing Digital Journalism and Society,‖
Radar, O‘Reilly Media, 28 de sep. de 2012, http://radar.oreilly.com/2012/09/open-
journalism-open-data-news.html (acceso 4 de febrero de 2015).
cccxxiii
J. McClure, ―Rendering Real-time,‖ IRE, 25 de febr. de 2012,
http://ire.org/blog/2012-car-conference-blog/2012/02/25/rendering-real-time/
(acceso 4 de febrero de 2015).
cccxxiv
A. Boiko-Weyrauch, ―From Where? Validating Data in the Real World,‖ IRE,
25 de febr. de 2012, http://ire.org/blog/2012-car-conference-
blog/2012/02/25/where-validating-data-real-world/ (acceso 4 de febrero de 2015).
cccxxv
M. Cruz, ―Improving News coverage with Data,‖ IRE, 25 de febr. de 2012,
http://ire.org/blog/2012-car-conference-blog/2012/02/25/improving-news-coverage-
data/ (acceso 4 de febrero de 2015).
cccxxvi
B. Adair, P. Kamalakanthan, and M. Stencel, ―The Goat Must Be Fed,‖ Duke
Reporters‘ Lab at the DeWitt Wallace Center for Media & Democracy in the
Sanford School of Public Policy, de mayo de 2014, http://www.goatmustbefed.com/
(acceso 4 de febrero de 2015).
cccxxvii
H. Finberg, ―Journalism Needs the Right Skills to Survive,‖ Poynter, 13 de
abr. de 2014, http://www.poynter.org/how-tos/journalism-
education/246563/journalism-needs-the-right-skills-to-survive/(acceso 4 de febrero
de 2015).
cccxxviii
―The Full New York Times Innovation Report,‖ Mashable, 16 de mayo de
2014, http://mashable.com/2014/05/16/full-new-york-times-innovation-report/
(acceso 4 de febrero de 2015).
cccxxix
J. Benton, ―The Leaked New York Times Innovation Report is One of the Key
Documents of This Media Age,‖ Nieman Journalism Lab, 15 de mayo de
2014://www.niemanlab.org/2014/05/the-leaked-new-york-times-innovation-report-
is-one-of-the-key-documents-of-this-media-age/ (acceso 4 de febrero de 2015).
cccxxx
R. Somaiya, ―With App and Premium Plan, The Times Expands Online
Offerings,‖ New York Times, 27 de febr.. de 2014,
http://www.nytimes.com/2014/03/27/business/media/the-times-is-expanding-its-
digital-subscriptions-offerings.html (acceso 4 de febrero de 2015).
cccxxxi
―How Y'all, Youse and You Guys Talk,‖ New York Times, 20 de dic.de 2013,
http://www.nytimes.com/interactive/2013/12/20/sunday-review/dialect-quiz-
map.html (acceso 4 de febrero de 2015).
cccxxxii
J. Benton, ―The New York Times has a (lovely) new cooking site,‖ Nieman
Journalism Lab, 14 de mayo de 2014, http://www.niemanlab.org/2014/05/the-new-
york-times-has-a-lovely-new-cooking-site/ (acceso 4 de febrero de 2015).
cccxxxiii
T. Bouza, ―Text is a ‗New Frontier' in Data Journalism, Says Head of the
IRE,‖ Computational Reporting, 2 de febr. de 2012,
http://www.computationalreporting.com/2012/02/27/text-is-a-new-frontier-in-data-
journalism-says-head-of-the-ire/ (acceso 4 de febrero de 2015).
cccxxxiv
D. Cohen, ―Digital Journalism and Digital Humanities,‖ 8 de febr. de 2012,
http://www.dancohen.org/2012/02/08/digital-journalism-and-digital-humanities/
(acceso 4 de febrero de 2015).
cccxxxv
M. Lorenz, N. Kayser-Bril, and G. McGhee, ―News Organizations Must
Become Hubs of Trusted Data in a Market Seeking (and Valuing) Trust,‖ Nieman
Journalism Lab, mzo. de 2011, http://www.niemanlab.org/2011/03/voices-news-
organizations-must-become-hubs-of-trusted-data-in-an-market-seeking-and-
valuing-trust/ (acceso 4 de febrero de 2015).
cccxxxvi
N. Perlroth, ―Hackers in China Attacked The Times for Last 4 Months,‖ New
York Times, 21 de en. de 2013,
http://www.nytimes.com/2013/01/31/technology/chinese-hackers-infiltrate-new-
york-times-computers.html?pagewanted=all (acceso 4 de febrero de 2015).
cccxxxvii
L. Rainie and K. Zuckuhr, ―E-Reading Rises as Device Ownership Jumps,‖
Pew Research Centers Internet American Life Project, 16 de en. de 2014,
http://www.pewinternet.org/2014/01/16/e-reading-rises-as-device-ownership-
jumps/
(acceso 4 de febrero de 2015).
cccxxxviii
―NPR Ethics Handbook,‖ http://ethics.npr.org/ (acceso 4 de febrero de
2015).
cccxxxix
M. Chalabi, ―Mapping Kidnappings in Nigeria (Updated),‖ DataLab,
FiveThirtyEight, 13 de mayo de 2014, http://fivethirtyeight.com/datalab/mapping-
kidnappings-in-nigeria/ (acceso 4 de febrero de 2015).
cccxl
D. Solomon, ―GDELT and the Problem of Decontextualized Data,‖ Source,
OpenNews, 14 de mayo de 2014, https://source.opennews.org/en-
US/articles/gdelt-decontextualized-data/ (acceso 4 de febrero de 2015).
cccxli
B. Keegan, ―The Need for Openness in Data Journalism,‖ briankeegan.com, 7
de abr. de 2014, http://www.brianckeegan.com/2014/04/the-need-for-openness-in-
data-journalism/ (acceso 23 de mayo de 2014).
cccxlii
A. Whitbey, ―Bad Data Journalism,‖ andrewwhitby.com, mayo de 2014,
http://andrewwhitby.com/bad-data-journalism/ (acceso 4 de febrero de 2015).
cccxliii
C. Donovan, ―Hacking in the Newsroom? What Journalists Should Know
About the Computer Fraud and Abuse Act,‖ Nieman Journalism Lab, mzo. de
2014, http://www.niemanlab.org/2014/03/hacking-in-the-newsroom-what-
journalists-should-know-about-the-computer-fraud-and-abuse-act/ (acceso 4 de
febrero de 2015).
cccxliv
A. Zeng, ―Hack or Hacker? Know When it is Appropriate to Access Data and
When it is Not,‖ Knight Lab, Northwestern University, 5 de mzo. de 2014,
http://knightlab.northwestern.edu/2014/03/05/hacks-or-hackers-when-it-is-
appropriate-access-data-and-when-it-is-not/ (acceso 4 de febrero de 2015).
cccxlv
N. Wingfield, ―Apple Rejects App Tracking Drone Strikes,‖ New York Times
Bits Blog, 30 de ag. de 2012, http://bits.blogs.nytimes.com/2012/08/30/apple-
rejects-app-tracking-drone-strikes/.
cccxlvi
S. Gallagher, ―Reporters Use Google, Find Breach, Get Branded as ‗Hackers,‘
‖ Ars Technica, 21 de mayo de 2013,
http://arstechnica.com/security/2013/05/reporters-use-google-find-breach-get-
branded-ashackers/.
cccxlvii
D. Kaplan, ―Why Open Data Isn‘t Enough,‖ Global Investigative Journalism
Network, 2 de abr.de 2013, http://gijn.org/2013/04/02/why-open-data-isnt-enough/
(acceso 23 de mayo de 2014).
cccxlviii
E. Bell, et al., Letter to Review Group on The Effects of Mass Surveillance on
Journalism, 10 de oct. de 2013, http://towcenter.org/blog/the-effects-of-mass-
surveillance-on-journalism/ .
cccxlix
Center for Technology in Government, University of Albany, ―Enabling Open
Government For All: A Planning Framework for Public Libraries,‖
http://imls.ctg.albany.edu/sites/default/files/Public-Library-Open-Govt-
Framework.pdf (acceso 4 de febrero de 2015).
cccl
E. Zuckerman, ―What Comes After Election Monitoring? Citizen Monitoring of
Infrastructure,‖ My Heart‘s in Accra, 26 de abr. de 2014,
http://www.ethanzuckerman.com/blog/2013/04/26/what-comes-after-election-
monitoring-citizen-monitoring-of-infrastructure/ (acceso 4 de febrero de 2015).
cccli
―Table B - Minority Employment by Race and Job Category,‖ American Society
of News Editors, 2013, http://asne.org/content.asp?pl=140&sl=130&contentid=130
(acceso 27 de mayo de 2014).
ccclii
―2013 Minority Percentages at Participating Online News Organizations,‖
American Society of News Editors, 2013,
http://asne.org/files/Minority%20percentages%20at%20participating%20ONLINE%
20organizations%20copy%282%29.pdf (acceso 27 de mayo de 2014).
cccliii
R. Prince, ―Diversity Protests Get Startups‘ Attention,‖ de mayonard Institute
for Journalism Education, 14 de mzo. de 2014,
http://mije.org/richardprince/diversity-protests-get-startups-attention (acceso 27 de
mayo de 2014).
cccliv
―An Open Letter to News Media Startups,‖ National Association of Black
Journalists, 13 de mzo. de 2014, http://www.nabj.org/news/164828/NABJ-An-
Open-Letter-to-News-Media-Startups.htm (acceso 27 de mayo de 2014).
ccclv
―An Analysis of Women‘s Participation in Information Technology Patenting,‖
National Center for Women in Information Technology, 2007,
http://www.ncwit.org/sites/default/files/legacy/pdf/PatentExecSumm.pdf (acceso 27
de mayo de 2014).
ccclvi
C. Rampell, ―I Am Woman, Watch Me Hack,‖ New York Times, 27 de oct. de
2013, http://www.nytimes.com/2013/10/27/magazine/i-am-woman-watch-me-
hack.html (acceso 27 de mayo de 2014).
ccclvii
C. Andersen, E. Bell, and C. Shirky, ―Post Industrial Journalism: Adapting to
the Present,‖ Tow Center for Digital Journalism, 27 de nov. de 2012,
http://towcenter.org/research/postindustrial-journalism/ ,(acceso 21 de mayo de
2014).
ccclviii
D. Brooks, ―The Philosophy of Data,‖ New York Times, 5 de febr.de 2013,
http://www.nytimes.com/2013/02/05/opinion/brooks-the-philosophy-of-data.html
(acceso 4 de febrero de 2015).
ccclix
K. Cukier and V.M. Schoenberger, ―The Rise of Big Data,‖ Foreign Affairs,
2013, http://www.foreignaffairs.com/articles/139104/kenneth-neil-cukier-and-viktor-
mayer-schoenberger/the-rise-of-big-data (acceso 4 de febrero de 2015).
ccclx
K. Cukier and V.M. Schoenberger, ―Robert McNamara and the Dangers of Big
Data at Ford and in the Vietnam War,‖ MIT Technology Review, 31 de mayo 2013,
http://www.technologyreview.com/news/514591/the-dictatorship-of-data/ (acceso 4
de febrero de 2015).
Agradecimientos
Sobre el autor
ÍNDICE
1. Cheryl Phillips
2. Angélica ―Momi‖ Peralta Ramos
3. Tasneem Raja
4. Sisi Wei
5. Chase Davis
6. Dan Hill
7. Jeremy Bowers
8. Aron Pilhofer
9. Scott Klein
10 Perfiles Radar
Cheryl Phillips
―Las historias pueden ser narradas de muchos modos diferentes‖ dijo Cheryl
Phillips. ―Una barra lateral que pudo haber sido un texto de 12 pulgadas, ahora es
una línea de tiempo o un mapa‖.
Phillips, periodista de investigación premiada, comenzará a enseñar este otoño
boreal a tratar los datos como una fuente, cuando comience un nuevo trabajo
como profesora de la escuela de posgrado de periodismo de Stanford, ayudando a
inaugurar el nuevo Laboratorio de Periodismo Computacional de Stanford.
―Cheryl Phillips trae una mezcla destacada de experiencia en periodismo de datos
y trabajo de investigación a nuestro programa. Los estudiantes y profesores están
ansiosos por comenzar a trabajar con ella para impulsar el campo en evolución del
periodismo computacional‖ dijo Jay Hamilton, profesor Hearst de Comunicaciones
y director del Programa de Periodismo de Stanford. ―Su énfasis en informes para
hacer que los funcionarios rindan cuentas, y su interés en el uso de datos para
reducir los costos de descubrir historias ayudarán a nuestros estudiantes de
periodismo a aprender a descubrir historias sobre asuntos públicos que
actualmente quedan sin informar‖.
Entrevisté a Phillips respecto de su carrera que incluye importantes informes sobre
el mundo de las organizaciones sin fines de lucro y de filantropía, sus planes para
enseñar en Stanford, el periodismo de datos, las escuelas de periodismo y la
enseñanza de técnicas digitales y los desafíos que enfrentan las redacciones hoy,
y en el futuro.
Trabajo en The Seattle Times desde 2002. Comencé como reportera centrada en
datos en el equipo de investigaciones, luego me convertí en la subeditora de
investigaciones y después, en editora de datos. Además estuve en la mesa
metropolitana y centralizaba un equipo de periodistas. Actualmente trabajo en el
departamento digital/online, pero en realidad, mi tarea abarca todos los
departamentos. También ayudé a capacitar a toda la redacción cuando pasamos a
un nuevo sistema de manejo de contenidos hace un año más o menos. Estoy
tratando de terminar un par de proyectos relacionados con historias y hago algo de
capacitación en periodismo de datos, antes de comenzar en Stanford en el otoño.
¿Cuáles son los mayores desafíos que enfrentan las salas de noticias para
responder a la demanda de gente con estas capacidades y experiencia?
Las salas de noticias siguen a menudo estructurados en silos, de modo que los
reporteros solo informan y escriben. Pueden llegar a entregar sus datos a una
mesa de gráficos, pero no analizan o visualizan necesariamente los datos por sí
mismos. Los productores producen, pero no escriben, aunque pueden disfrutarlo y
además, hacerlo bien.
En parte esto es así por necesidad, pero dificulta aprender nuevas capacidades, y
algunas de estas capacidades son realmente útiles. El reportero que sabe cómo
visualizar datos puede también ser capaz de mirar las cosas de un modo diferente
para narrar la historia. Por lo que es importante crear equipos de colaboración,
como lo es también, dar tiempo a la gente para que pruebe con otras capacidades.
Momi Peralta
Mucho antes de que el periodismo de datos ingresara en el discurso común, La
Nación se esforzaba por ampliar, dentro de lo posible, estos límites en la
Argentina, informando en un país que no cuenta con una ley de libertad de acceso
a la información. Si se exploran los esfuerzos en el tratamiento de los datos como
fuente de La Nación online, se encuentra a Angélica ―Momi‖ Peralta Ramos
(@momiperalta), gerente de desarrollo multimedia quien lanzó originalmente
LaNacion.com en la década de 1990, y ahora conduce los emprendimientos de
periodismo de datos.
Peralta Ramos sostiene que la innovación basada en datos es un antídoto para las
crisis presupuestarias en las redacciones. Su perspectiva se basa en la
experiencia: el equipo de Peralta en La Nación está usando el periodismo de datos
para cuestionar la cultura basada en la ausencia de una ley de libertad de acceso
a la información en la Argentina y está abriendo los datos para informes y su
reutilización con la perspectiva de hacer que los gobiernos rindan cuentas. Esta
primavera boreal la entrevisté acerca de su trabajo y sus perspectivas. A
continuación van sus respuestas, ligeramente editadas para mayor claridad.
En 1995 estábamos solos. Todo era nuevo y resultaba difícil de vender. Había un
público pequeño. La producción de contenido era estática, aún en dos
dimensiones, quizás incluyendo una imagen formato .jpg y la retroalimentación
llegaba por correo electrónico.
Ahora hay un público inmenso, un ambiente atestado y competitivo, y las cosas se
mueven más rápido que nunca en términos de formatos, tecnologías, negocios y
usos creativo por el público. Todos los días hay desafíos y oportunidades de llegar
al público y darle algo diferente o útil para que nos recuerden y vuelvan.
Las leyes de libertad de información son vitales para el periodismo, pero más
vitales son para los ciudadanos en general, para el sistema judicial, para los
políticos, para las empresas e inversores para tomar decisiones. Cualquiera puede
reeditar información si la puede obtener, pero hay pedidos de información que no
reciben respuesta alguna.
__________________________________________________________________
Tasneem Raja
1. La conferencia NICAR
2. Twitter
3. Cada vez más, libros impresos
4. Disecando el trabajo de colegas en otros medios
¿Cuáles son los mayores desafíos que enfrentan las salas de noticias al
responder a la demanda de gente con estas capacidades y experiencia?
¿Las universidades están capacitando a la gente adecuadamente?
Hay toneladas de desafíos, así que elijo uno: no tenemos un modelo de
programación de a pares del lado editorial de la sala de noticias y lo
necesitamos.
Las escuelas de periodismo enseñan el periodismo como una disciplina jerárquica,
a menudo solitaria. No funciona así en el periodismo de datos y el mejor
aprendizaje se sigue dando en el trabajo. Eso requiere polinización cruzada entre
gente con distintas capacidades. Necesitamos un modelo de complementación
que abarque toda redacción, no solo el rincón de los nerds.
Varias personas me han dicho que les sorprende lo pequeño que es nuestro
equipo, dado el volumen diario de contenido que obtenemos. Eso se debe a que
no somos los únicos que podemos trabajar con datos y visualizaciones en nuestra
sala de noticias. Hemos dedicado mucho tiempo a trabajar en conjunto con 1 de
cada 3 redactores aquí, trabajando y capacitándonos lado a lado cuando es
posible. (Tenemos oficinas en las dos costas). Hemos contactado varios editores y
reporteros a través de Github y aunque no los tenemos verificando el código a
través de la línea de comando (aún) conocen sobre control de versiones.
NICAR es un lugar bastante bueno para estar sin ser blanco, ni varón si uno
trabaja en periodismo. Y no puedo hablar de cuestiones de clase, capacidad,
identidad de género y otros tipos de diferencias, fuera de decir que no las
manejamos tan bien y eso tiene que cambiar.
_________________________________________________________________
Sisi Wei
Lo más cercano a una capacitación formal que tuve fue un curso de ―Introducción
a estadísticas‖ en mi último año, que ojalá hubiera tomado antes. También tenía
buena base matemática, no siendo mi tema principal. El último curso de
matemática avanzada que tomé en el college fue sobre álgebra lineal y cálculo
multivariable. Y no es que hasta la actualidad, haya usado esto en mi trabajo.
―Si lee publicaciones populares de critica a los medios encontrará una larga letanía
de quejas repetidas sobre el periodismo moderno. No cubre temas importantes,
depende demasiado de las gacetillas de prensa, se ve fácilmente manipulado por
los políticos y los sectores con intereses especiales, y no comunica lo que sabe de
modo efectivo. Todas estas quejas se justifican. Su causa no es tanto una falta de
energía o talento o dedicación o verdad, como insinúan a veces los críticos, sino
un simple atraso en la aplicación de la ciencia informática -un cuerpo de
conocimientos- a los problemas abrumadores de informar las noticias en un
tiempo de sobrecarga de información‖.
El periodismo de datos permite a los periodistas apuntar a los datos en crudo y
hacer preguntas cuestionando al mismo tiempo las conclusiones que nos dan.
Permite usar técnicas de ciencias sociales para iluminar historias que de otro
modo podrían quedar ocultas a plena vista.
Las aplicaciones de noticias específicamente permiten a los usuarios buscar lo
que es más relevante para ellos en una base de datos grande y dar a los lectores
individuales el poder de descubrir cómo se relaciona con ellos una importante
historia nacional. Si la historia es sobre los doctores que están recibiendo pagos
de compañías farmacéuticas, las aplicaciones noticiosas le permiten hacer una
búsqueda para ver si su médico también lo ha hecho.
Chase Davis
Chase Davis es editor adjunto en la mesa de noticias interactivas del New York
Times y dicta un curso de periodismo de datos avanzado en Mizzou, donde ayuda
a transferir sus capacidades y visión (tratando a los datos como fuente). A
continuación, nuestra entrevista, ligeramente editada para más claridad, contenido
con hipervínculos para dar contexto.
¿Cuáles son los mayores desafíos que enfrentan las salas de noticias para
responder a la demanda de personas con estas capacidades y experiencia?
¿Las escuelas están formando adecuadamente a la gente?
¿En qué ha cambiado la práctica del periodismo hoy comparado con hace
diez años?
Fue hace diez años que me inicié en el periodismo de datos, lo que me hace sentir
viejo aunque no lo sea. Por entonces, el periodismo de datos se veía
principalmente como hacer análisis para historias. Sin duda, grandes historias,
pero los interactivos y las visualizaciones de datos eran algo más raro.
Ahora el periodismo de datos es más una especialidad genérica. Los periodistas
de datos informan y escriben, crean interactivos y visualizaciones, desarrollan
plataformas para narrar historias, trabajan con modelos de predicción, crean
software de código abierto y mucho, mucho más. El ritmo realmente se ha
acelerado, que es la razón por la que resulta tan importante la auto-educación.
_________________________________________________________________
Dan Hill
¿Cuáles son los mayores desafíos que enfrentan las salas de noticias
respecto de la demanda de gente con estas capacidades y experiencia? ¿Las
escuelas están capacitando a la gente de modo adecuado?
Creo que las diferencias entre las culturas de los programadores y la sala de
noticias dificultan a las redacciones conseguir gente con las capacidades
tecnológicas y de periodismo para coordinar proyectos con programadores y
periodistas. Como estudiante de la escuela de periodismo fui inspirado para saber
más sobre datos cuando el profesor Darnell Little me mostró cómo podría mejorar
mi capacidad de reportero al ayudarme a encontrar historias en conjuntos de
datos.
¿Cuáles son los proyectos de periodismo de los que estás más orgulloso
por haber trabajado en ellos o haberlos creado?
Mi proyecto como pasante de verano en The Washington Post, un estudio de
todos los casos de homicidios en Washington D.C. entre 2000 y 2011, fue mi
primera experiencia haciendo aplicaciones de noticias en una redacción. Fue un
honor trabajar con los reporteros de investigaciones como novato y aprendí
muchísimo en la creación de base de datos y análisis con Serdar. Todos mis
aportes estuvieron relacionados con la parte no accesible al público, pero me
encantó trabajar con ese conjunto de datos como pasante.
¿En qué difiere practicar el periodismo de datos hoy versus hace 10 años?
Yo no era siquiera un adolescente hace 10 años pero diría que... INTERNET. Los
portales de datos online, las cosas de gobierno abierto y de red abierta son
importantes para el periodismo de datos que hago. No estoy seguro de que fueran
tan comunes hace una década.
__________________________________________________________________
Jeremy Bowers
¿En qué ha cambiado la práctica del periodismo hoy comparado con hace
diez años?
No puedo generalizar, dado que comencé a hacer ―periodismo de datos‖ hace
unos cinco años. Dudo en sostener que lo que actualmente hago es realmente
periodismo de datos si lo comparo con el desarrollo de productos de la sala de
noticias.
Para no dejarte sin respuesta, puedo decir que mi trabajo ahora es mucho más
riguroso. Cuando comencé a programar en el St. Petersburg Times no usábamos
control de versión. No hacíamos pruebas aisladas de lo programado antes de
usarlo. No teníamos herramientas de despliegue automatizado. En estos tiempos
contamos con GitHub para almacenar lo programado, toneladas de trucos de línea
de comando para mantener lo programado en ambientes virtuales por separado, y
tenemos herramientas de implementación fantásticas con lo que actualizamos
fácilmente nuestros programas.
Además mi organización es mucho más consciente de lo que hago. Mi jefe y sus
jefes conocen mucho más de periodismo de datos en general y específicamente
de cómo encaja nuestro trabajo con la estrategia de la organización. Cuando
comencé trabajábamos de modo invisible en productos de los que prácticamente
nadie sabía o le importaban.
Aron Pilhofer
¿En qué está trabajando ahora que sea nuevo y potencialmente importante?
Acabamos de crear un equipo de analítica de la sala de noticias. El tipo de
proyecto que hacemos allí es totalmente editorial. No están atados a la publicidad
para nada.
En este momento muchas salas de noticias se manejan de modo estúpido en la
forma que publican. Están atadas a un modelo heredado, que significa que parte
del periodismo más impactante se publica online el sábado por la tarde para
imprimirse el domingo. No hay momento en que el público esté menos motivado.
El material se queda en el sitio y allí permanece hasta la mañana siguiente, y el
domingo un editor de la página decidirá que ha estado demasiado tiempo o decide
actualizar la página y lo pone más abajo.
Creo firmemente, y ahora hay un creciente consenso, de que debemos tomar
decisiones como esas, basado en datos. ¿Cuál será el público para determinado
contenido? ¿Quién es? ¿Qué lee? Eso llevará a un enfoque muy distinto de lo que
significa ser una empresa editora.
Conocer el púbico al que apuntamos definirá una estrategia de publicación
completamente diferente. Iremos de ―publicar‖ a ―lanzar‖. También nos llevará en
una dirección que es inevitable, donde separemos el modelo heredado del digital.
¿En qué punto decidimos que el público digital es tan importante -o más
importante- que el de la edición impresa?
Esto suena similar al enfoque que llevan adelante muchas bocas de salida
online.
No hay ninguna página digital del planeta que no haga este tipo de cosa o al
menos ninguna que sea inteligente. Medium tiene su propia métrica. Upworthy usa
los minutos de atención que reflejan compromiso.
El equipo de [The Interactive News] puede crear casi cualquier cosa ahora a la
escala de una cantidad enorme de tráfico, ligándose a todo el sistema del New
York Times. Ese ya no es el problema. Podemos hacer funcionar todo [desde el
punto de vista técnico] el proyecto de David Leonhardt, que es nuestra respuesta a
538, pero aún así puede no encontrar un público.
Esto es el desarrollo de un producto, donde tomamos un gusto particular de
periodismo y encontramos un público. Encontramos la manera de que un público
que querría eso lo encuentre. Es difícil pensar en esto cuando uno solo conoce
una cosa: su propia página. Es realmente poderoso, pero con eso solo no basta.
¿Cómo cambia eso lo que estamos desarrollando? ¿Cómo podemos lograr que el
público vuelva sistemáticamente?
Crear interactivos individuales no es tan importante. Cuando uno comienza a crear
recursos duraderos, como lo que hizo John Keefe con su Cicada Project o lo que
Scott Klein ha creado con Dollars for Docs. Hay que pensar en estas cosas en
mayor profundidad. ¿Y quién en la sala de noticias está en mejor situación para
hacer eso que el periodista de datos?
¿Entonces es endémico?
No sé cómo resolverlo. Hay que ver que NICAR viene durando tanto. Al comienzo
tenían la creencia ingenua de que si podían capacitar suficiente gente, la
organización sería irrelevante. Ahora cuando uno mira al pasado, resulta gracioso.
Obviamente, eso no va a suceder por motivos prácticos. No creo que estemos
cerca del punto en que se pueda decir, con capacitación y tiempo, no se va a
necesitar más especialistas en la sala de noticias. Estamos tan lejos de eso.
Scott Klein
Hay maneras de diseñar datos de modo que las cifras más importantes aparezcan
más grandes y destacadas que detalles menos importantes. La gente sabe que
tiene que desplazarse hacia abajo en una página para detalles más finos. En
ProPublica diseñamos las cosas para llevar a los lectores a avanzar a través de
niveles de abstracción, del caso nacional más general, al ejemplo más local.
__________________________________________________________________
Entrevistas Radar
Para conocer más acerca de gente que está redefiniendo la práctica del
periodismo asistido por computadora, hice una serie de entrevistas por correo
electrónico con periodistas de datos durante la Conferencia NICAR de 2012. Están
disponibles online y sus vínculos aparecen a continuación.