FINALE Etude EY-FA Big Data 251113
FINALE Etude EY-FA Big Data 251113
FINALE Etude EY-FA Big Data 251113
et données personnelles
au cœur du Big data
Entre la nécessaire protection et une exploitation
au service des nouveaux équilibres économiques
Sommaire
1. Faire parler le Big data : un nouveau pouvoir p. 7
dans le secteur médiatique et culturel
• Du Big data au Worthy data p. 8
• La donnée personnelle culturelle au cœur de l'émergence p. 14
d'un marché stratégique
2. Pouvoirs en équilibre et responsabilités partagées : p. 19
les nouveaux contours du Big data
• La réglementation, impulsion économique p. 21
pour les acteurs de Big data en Europe
• Quelle fiscalité 3.0 pour l'économie digitale ? p. 33
• Responsabilités citoyennes p. 37
3. Vers un nouveau paradigme économique p. 39
propice à l’innovation et la création
• Opposer le principe de précaution au Big data : p. 40
un risque réel pour l’innovation
• Le temps de l'action p. 42
• La nouvelle chaîne de valeur de la donnée personnelle culturelle p. 47
La présente publication peut être téléchargée sur les sites d’EY (www.ey.com/mediaentertainment)
et du Forum d’Avignon (www.forum-avignon.org).
Avant-propos
6 ans de partenariat entre EY et le Forum d’Avignon
La vocation première du Forum d’Avignon est de se faire l’écho des enjeux qui comptent pour les industries
de l’art et de la création. Le partenariat qui lie depuis maintenant six ans EY au Forum témoigne
d’un engagement commun, aux côtés des grands acteurs de l’univers des médias et du divertissement.
Depuis 2008, EY analyse les grandes thématiques inscrites La donnée personnelle culturelle, autour de laquelle se structure
au programme du Forum, pour leur donner, en capitalisant aujourd’hui un marché à la recherche de nouveaux équilibres,
sur son expertise et son expérience reconnue dans le secteur, est à l'origine d’une ruée d’acteurs des secteurs numérique,
une traduction concrète à travers l’identification d’enseignements médiatique et culturel, parce qu'elle vaut de l'or.
majeurs.
Année après année, EY a observé et décrypté les mouvements Méthodologie de l’étude :
à l’œuvre dans l’industrie des médias et des contenus, face à
une révolution digitale qui a rebattu les cartes des forces en Pour mieux comprendre, analyser et interpréter ces nouveaux
présence, à travers le prisme de la propriété intellectuelle (« La enjeux de contrôle et la structuration d’un nouveau marché
propriété intellectuelle à l’ère du numérique »), de la monétisation autour de la donnée personnelle culturelle, EY a rencontré
(« Monétiser les médias numériques ») ou encore de la vitesse de et interrogé des dirigeants d’institutions et d'entreprises
diffusion (« Maîtriser le tempo, organiser la relation entre le temps représentatives du secteur, dont la Réunion des musées
et la valeur dans l’industrie des médias et du divertissement »). nationaux - Grand Palais, l’INA, Solocal (PagesJaunes), Criteo,
L’écosystème qui s’est progressivement structuré semblait tendre InterCloud, Kantar Media... Cette étude qui a mobilisé nos experts
jusqu’à présent vers un point d’équilibre entre les opérateurs du secteur Médias et Divertissement, se fonde sur leurs points de
de l'Internet, de télécomunications et les groupes médias. vue, notre recherche sectorielle et nos propres analyses.
Néanmoins les enseignements de nos dernières études laissaient
déjà entrevoir la déferlante Big data, qui pourrait introduire un
nouveau facteur de déstabilisation, laissant un nombre restreint
d’acteurs, capables de faire parler le Big data, détenir le pouvoir
de contrôler et de prévoir.
Remerciements
EY tient à remercier vivement pour leurs éclairages :
Roei Amit (Directeur adjoint chargé du numérique, Réunion des musées nationaux - Grand Palais), Christophe Benavent
(Professeur, Responsable du Master Marketing opérationnel international, Université Paris Ouest), Julien Billot (Directeur
général adjoint en charge du segment média, Solocal - ex PagesJaunes), Jérôme Dilouya (Fondateur et Président-directeur
général, Intercloud), Denis Gaucher (Directeur exécutif Ad Intelligence Europe, Kantar Media), Alban de Nervaux (Directeur
de la stratégie et du développement, Réunion des musées nationaux - Grand Palais), Alexandra Pelissero (Directrice de la
communication, Criteo), Stéphane Ramezi (Responsable des éditions multimédia, INA).
Nous tenons aussi à remercier, pour leur apport lors des groupes de travail : Benoît Tabaka (Directeur des politiques publiques,
Google France), Pierre Geslot (Responsable Projets Lectures numériques, France Télécom Group), Laure Kaltenbach (Directrice
générale, Forum d'Avignon), Olivier Le Guay (Responsable éditorial, Forum d'Avignon).
C’est l’évolution de l’humanité tout entière qui est indissociable Car au cœur de cette masse de données vertigineuse brille une
des traces, empreintes et autres indices que nous laissons catégorie de données qui vaut de l’or : la donnée personnelle
derrière nous. Avec l’avènement de l’ère numérique et l’apparition culturelle. Lorsque nous observons le bouleversement des
des traces immatérielles dont nous marquons la toile et que nous rapports de force entre opérateurs Internet, opérateurs de
pouvons désormais collecter, stocker et analyser à l’infini1, réseaux et groupes médias, sous l’effet de l’explosion des traces
nous est aujourd’hui donné un pouvoir inédit. Au pouvoir et informations liées à la révolution digitale, force est de constater
régalien, détrôné peu à peu par l’ouverture du savoir au plus la ruée de tous ces acteurs vers cette donnée personnelle
grand nombre à travers l’imprimerie, la radio et la télévision culturelle, nouveau sésame qui leur ouvrirait les portes de
- et duquel le règne d’Internet a semblé définitivement nous l’intimité de l’être.
affranchir - succède aujourd’hui le pouvoir de contrôler et de
À la fois miroir de nos goûts et de nos aspirations et reflet
prévoir, grâce à l’ouverture de données publiques et personnelles
de l’image sociale que nous souhaitons renvoyer, la donnée
de tous à un nombre d’acteurs restreints, capables de faire parler
personnelle culturelle représente en effet un fragment de notre
le « Big data ».
identité. Une donnée d’autant plus précieuse qu’elle introduit un
Volume, variété et vélocité : c’est en ces trois mots que peut se rapport inédit en réconciliant l’empreinte et le calcul3 : si, à la
résumer le Big data, pour exprimer le volume inédit de données manière d’une photographie, la donnée numérique conserve la
produites et échangées par un nombre croissant de canaux trace de notre activité digitale, elle s’en distingue toutefois par sa
(web, objets connectés au web et entre eux, plateformes), la disponibilité au calcul.
variété de ces données (avec une part croissante de données
Contrairement à une simple photographie, qui comme le rappelait
non structurées et volatiles2) et enfin la vélocité, qui désigne la
Roland Barthes4, « ne se distingue jamais de son référent,
vitesse, toujours plus grande, de ces échanges.
de ce qu'elle représente. [Le référent] s'entête à être toujours là,
Le Big data représente une formidable matière première pour il adhère », la donnée personnelle numérique est détachable et
qui saura en extraire la substantifique moelle, avec à la clé calculable.
des opportunités de création de valeur qui pourront irriguer
l’ensemble des secteurs d’activité de l’économie réelle… et en
particulier celui de l’industrie médiatique et culturelle.
1 Un yottaoctet est la capacité annoncée du nouveau data center de la NSA (National Security Agency) pour 2013, soit mille fois la totalité des données enregistrées en 2011
dans le monde - Sarah Belouezzane et Cécile Ducourtieux, « Vertigineux "Big data" », Le Monde, 26 décembre 2012
2 Données de géolocalisation, événementielles
3 Louise Merzeau « Faire mémoire des traces numériques », E-dossiers de l’audiovisuel, Sciences humaines et sociales et patrimoine numérique, INA, mis en ligne en juin 2012
4 Roland Barthes, La chambre claire - éd. Gallimard, 1980
5 Kord Davis, "Ethics of Big data – Balancing risk and innovation" - ed. O’Reilly Media, Septembre 2012
6 René Trégouët, Sénateur, « Des pyramides du pouvoir aux réseaux de savoirs - Tome 1 », Rapport d'information 331 - 1997/1998 - Commission des Finances, site internet du Sénat,
consulté le 10 octobre 2013
| 7
Du Big data au Worthy data
Des traces à l’ADN de l’être numérique
Une explosion des traces numériques
Depuis quelques années, les données numériques connaissent En naviguant sur Internet, un utilisateur laisse des traces de
une croissance exponentielle et forment une masse gigantesque natures variées. Ces données sont collectées selon différents
de data, autrement appelée Big data. modes opératoires et lui sont rattachées a priori ou a posteriori,
selon qu’il se sera identifié volontairement, ou qu’il sera
L’augmentation de cette masse de données s’explique par trois
identifiable par recoupement (ex. : cookies, adresse IP, adresse
facteurs, connus sous la formule des 3V :
MAC).
• Le boom du volume de données émises : l’individu, de plus en
plus nomade, produit davantage de données, laissant derrière Aux 3V du Big data s’ajoute la valeur que représentent ces
lui en temps réel des traces numériques toujours plus fraîches. données, pour l’entreprise mais aussi pour l’utilisateur.
En parallèle, les capacités de stockage augmentent également En effet, l’exploitation de ces « traces » numériques peut offrir
de façon exponentielle, ce qui permet de conserver un aux utilisateurs un réel confort de navigation et leur fournir
historique de toutes ces traces numériques. En 2013, les des services de qualité (mise à disposition d’une boîte mail,
volumes de données créées ou manipulées auront dépassé les obtention d’applications gratuites, jeux gratuits, etc.), sans
4 zettaoctets1, soit l’équivalent d’une pile de DVD mesurant la contreparties financières directes. Conscientes de la forte
hauteur de… 4 millions de tours Montparnasse2. valeur de ces données, les entreprises tentent d’instaurer ou de
gérer une relation donnant-donnant, visant à récompenser les
• La variété des outils connectés s’étend : du portable au
utilisateurs qui transmettent leurs données personnelles, en leur
réfrigérateur, de la tablette à la voiture intelligente en passant
offrant des produits ou services pour les inciter à révéler leurs
par la smart TV, le nombre d’objets connectés explose, comme
préférences de consommation et des centres d’intérêt, via, par
en témoigne la demande croissante d’adresses IP. Capables de
exemple, des commentaires sur les réseaux. Toutefois, proposer
communiquer entre eux, ces objets qui forment « l’Internet des
des services additionnels contre les données cédées suppose un
objets », peuvent tracer leurs utilisateurs et envoyer des
équilibre délicat pour les entreprises : les consommateurs, pas
informations précises sur leurs mouvements et habitudes,
toujours conscients de la portée de ce rapport donnant-donnant,
même quand ceux-ci ne les utilisent pas. Une variété qui
peuvent se montrer réticents à l’idée d’être considérés comme
qualifie également la masse non structurée des données
des produits monétisables. D’où l’importance de porter à leur
produites par ces multiples sources, qui émettent des données
connaissance ce qu’ils sont en mesure de faire pour contrôler
présentant autant de codes, langages et formats différents.
leurs données personnelles. • En savoir plus p. 37
• La vélocité de l’information, à savoir la vitesse à laquelle les Cette masse de données numériques, à l’instar de la masse
données sont traitées simultanément, augmente elle aussi : monétaire, aurait-elle atteint un seuil suffisamment critique
ces données circulent toujours plus vite, émises par des pour faire fonctionner un système économique à part entière ?
sources toujours plus interconnectées et interdépendantes, Existe-t-il une hiérarchie de valeur entre ces traces numériques ?
dans des réseaux qui fonctionnent de moins en moins en silos. Quelle est la valeur de cette donnée numérique ?
1 « Big data, nouveaux défis », Revue de l’Association Telecom ParisTech Alumni, n° 169, juillet 2013
2 Une pile de DVD de la hauteur de la tour Montparnasse = 1 pétaoctet (équivalences : 1 zettaoctet = 1021 octets ou 106 pétaoctets) - Sarah Belouezzane et Cécile Ducourtieux,
« Vertigineux "Big data" », Le Monde, 26 décembre 2012
5
2 En 2011, il fallait 2 jours 24 h
exaoctets pour les générer
24 h
de données générées
depuis les premières mesures
jusqu’en 2003 2 En 2013, il faut 10 minutes
10 min
pour les générer
Octet Kilo-octet (Ko) Mégaoctet (Mo) Gigaoctet (Go) Téraoctet (To) Pétaoctet (Po) Exaoctet (Eo) Zettaoctet (Zo) Yottaoctet (Yo)
1 000 octets 1 000 Ko 1 000 Mo 1 000 Go 1 000 To 1 000 Po 1 000 Eo 1 000 Zo
Source : CNRS
Quelles traces laissées par une simple recherche culturelle sur le web ?
Exemple : réservation d’une entrée pour une exposition au Grand Palais
Traces numériques
Action utilisateur Services en contrepartie
à caractère majoritairement personnel
Session utilisateur
• Données de contact (âge, sexe, coordonnées…)
• Moteur de recherche • Données de connaissance (CSP, intérêts, relations,
• Messagerie profil de consommation…)
• Site tiers
• Réseau social…
• Rapidité de navigation
• Confort d’utilisation
Logiciel • Environnement logiciel
• Informations collectées par cookies
• Navigateur • Favoris, historique, paramètres, préférences • Richesse des informations
• Système d’exploitation de navigation et des services en ligne
Une production de données toujours plus exhaustive, pour une meilleure appréhension
du comportement culturel de l’être numérique
Si, du côté de l’offre, la donnée personnelle culturelle est Ceci permet de prolonger l’expérience culturelle des clients et
longtemps restée cantonnée à l’analyse des paiements, de nouer une relation d’engagement avec eux. Une relation qui
on observe aujourd’hui chez les entreprises et établissements fournira de précieuses informations client, à condition d’être
du secteur médiatique et culturel un prolongement de capable d’engranger et de lier efficacement une quantité et une
l’expérience culturelle en-deçà et au-delà des transactions de variété inédites d’informations, générées dans des espaces et
paiement. Ces acteurs tendent à enrichir leurs offres de services temporalités différents.
culturels via un continuum de services.
Les comportements culturels, davantage que les traditionnels CSP, apportent de la valeur aux profils numériques.
1 Selon une définition consacrée, est une « donnée publique culturelle » la donnée produite ou détenue par un établissement, organisme ou service culturel ayant une activité culturelle
réelle et effective (Source : Guide Data Culture).
Ex. : inventaire du fonds artistique, horaire d'ouverture, catalogue d'exposition, œuvre du domaine public...
2 Données sur les actes d'achats de biens et services culturels.
Ex. : nombre d'entrées en salle, vente de disques, entrées aux musées, détenteurs de cartes d'abonnement, ventes Amazon...
3 Données de contact et qualification collectées au travers des opérations des acteurs de l'industrie culturelle.
Ex. : abonnés de l'espace personnel du Louvre, participants aux jeux-concours de promotion musicale, abonnés newsletters, données de navigation...
4 Ensemble des données permettant de connaître les préférences culturelles des consommateurs.
Ex. : discussions dans des forums, réseaux sociaux, avis et commentaires sur des œuvres/artistes...
Source : EY ©
Tendance 2 Entrée des GAFA2 sur le marché des données personnelles culturelles
1 « Social TV : Facebook partagera ses données avec TF1 et Canal+ », Le Monde, 7 octobre 2013
2 GAFA désigne les Big 4 du numérique : Google, Apple, Facebook, Amazon
3 Début 2012, Google avait numérisé plus de 20 millions d’ouvrages (Jennifer Howard, “Google Begins to Scale Back Its Scanning of Books From University Libraries”, 9 mars 2012,
site visité le 10 octobre 2013) et le coût de numérisation de l’intégralité du catalogue de la Bibliothèque nationale de France (BNF), soit environ 15 millions d’ouvrages, est estimé à
750 millions (selon Yann Gaillard, rapporteur spécial de la Commission des finances pour la mission « Culture » et auteur du rapport intitulé : « La politique du livre face au défi du
numérique. »)
L'information sur la localisation géographique des data centers est très difficile à obtenir et jugée stratégique par les grands acteurs
du secteur. Sur la base des informations publiques disponibles et pour les data centers vendant leurs services, EY a réalisé une carte
anamorphose des data centers, qui montre l'avancée des États-Unis en matière de capacité de stockage de données, par rapport à
l'Europe et aux autres régions du monde.
Les capacités de stockage dont se dotent les grands collecteurs de données sont bien supérieures aux besoins à très court terme
comme en atteste la capacité du dernier data center de la National Security Agency (NSA), qui atteint 1 yottaoctet4.
En outre, l’analyse des charges et revenus des GAFA montre que si la R&D, le stockage et le traitement des données constituent une
part significative des coûts, l’exploitation directe des données Big data ne constitue qu’une faible partie des revenus, l’essentiel5 de
ces derniers provenant de la publicité ou de la distribution.
4 Sarah Belouezzane et Cécile Ducourtieux, « Vertigineux "Big data" », Le Monde, 26 décembre 2012
5 Les revenus issus de l’exploitation directe des données Big data sont issus de la vente de services de stockage, de traitement et analyses de données Big data, Jeffrey Kelly, David Floyer,
Dave Vellante, Stu Miniman, "Big Data Vendor Revenue and Market Forecast 2012-2017", Wikibon, octobre 2013
Des coûts marginaux dégressifs Cet effet « boule de neige » (winner-take-all effect) ajouté à la
barrière du coût initial, aux fortes économies d’échelles et à un
Les investissements initiaux sont principalement relatifs à niveau important de sunk costs tend inévitablement à concentrer
« l’infrastructure Big data » : serveurs, data centers, algorithmes. le marché à moyen terme.
Si la collecte massive de données personnelles, ainsi que le
développement des algorithmes pour les exploiter nécessitent Un marché touchant au « bien commun »
de lourds investissements de départ pour fournir le service au Le marché de la donnée personnelle culturelle est sensible car
premier client, les coûts nécessaires à l'acquisition de clients les informations concernant les comportements culturels d'une
supplémentaires sont dégressifs. population donnée et leur exploitation sont souvent issues
de statistiques ou d’enquêtes publiques et traitées/analysées
Un marché où seuls quelques acteurs
à l’échelle nationale, par les instituts de statistiques publics.
pourront survivre à moyen terme Rappelons par ailleurs que la propriété intellectuelle culturelle
Toutes les entreprises n’ont pas les moyens d’investir dans tombe dans le domaine public après une longue période
cette infrastructure dont le niveau déterminera la qualité de d’exploitation par les auteurs et producteurs de ces données/
l’exploitation des data. Ainsi, les chances de réussite d’un nouvel contenus1.
acteur sont loin d’être certaines, d’autant que celui-ci risque
d’encourir des sunk costs importants.
« Nous sommes face à l’enjeu suivant :
Par ailleurs, l’acteur qui possède la plus grande masse qui va gagner la course au CRM du web ?
d’informations (réseau social, application, operating system, etc.)
[…] Celui qui aura atteint la masse critique
et dispose des algorithmes les plus puissants attirera davantage
de clients et collectera d'autant plus de données fiables de données aura gagné la course de vitesse
additionnelles. Ceci aura pour conséquence de renforcer la qualité du CRM digital. »
de ses analyses et de ses algorithmes et, in fine, sa position sur le Roei Amit, Directeur adjoint chargé du numérique à la
marché. Réunion des musées nationaux - Grand Palais (Rmn-GP)
1
« La propriété intellectuelle à l’ère du numérique – Défis et opportunités pour le secteur Médias et Divertissement », EY, Novembre 2011
| 19
« Si l’on veut construire une innovation
durable, qui ne soit pas rejetée par
l’utilisateur, les entreprises doivent apporter
des garanties en termes de protection des
données personnelles. Ce n’est pas un coût,
c’est un investissement. »
Isabelle Falque Pierrotin, « Data, la nouvelle ruée
vers l’or », Enjeux Les Échos, mars 2013
La masse de traces numériques disponibles est En effet, pour garantir son développement
désormais suffisante pour permettre de suivre et harmonieux à moyen et long termes et favoriser
de modéliser des « êtres numériques » rationnels un nouvel écosystème économique innovant
et cohérents. Dans cette course à l’extraction et et créateur de valeur pérenne, il faut s’assurer
à l’analyse de données pertinentes, se dessinent que l’échange et l’utilisation massive des données
les contours d’un marché à part entière : il s’agit personnelles culturelles se fassent dans le respect de
du marché des données personnelles culturelles la vie privée de chaque individu, premier producteur
numériques. de données personnelles culturelles. Mais aussi
favoriser les investissements des entreprises quant
S’il ouvre des perspectives économiques
à la collecte et à l’organisation des données et enfin
prometteuses et étonnantes, ce nouveau marché doit
instaurer une saine concurrence économique.
cependant être accompagné dans sa structuration et
son développement.
1 Dominique Boulier, Vie Privée à l’Horizon 2020, Cahier IP n° 1, CNIL, novembre 2012
The Guardian a mis en place une application en ligne afin de permettre aux internautes
de comprendre comment ils sont suivis en ligne et par qui. Les cercles rouges sont les
dix premières sociétés de tracking les plus prolifiques ; les cercles bleus se réfèrent
aux 100 sites les plus populaires qui les utilisent.
www.theguardian.com
Philosophie/Objectifs
Philosophie/Objectifs
• La défense du droit à la vie privée comme droit fondamental
• La protection du consommateur et la poursuite d'un équilibre entre
supérieur à tout autre intérêt commercial.
protection de la vie privée et intérêt business.
• Une prise en compte à géométrie variable des risques liés à la
• La sécurité informatique au cœur des dispositifs réglementaires de
sécurité informatique, notamment s'agissant des obligations de
protection des données notamment au travers des obligations de
notification des failles de sécurité aujourd'hui limitées aux seuls
notification des failles de sécurité imposées à toutes les entreprises.
prestataires de communications électroniques.
1 Traduction libre de Gabriela Zanfir - "European Integration Realities and Perspectives: EU and US Data Protection Reforms. A Comparative View."
Le projet de Règlement (proposition de la Commission Les démarches « privacy by design » et « privacy by default »
européenne avant la prise en compte des amendements du vont également venir renforcer l’effectivité des règles
Parlement européen) sur la protection des données européennes en matière de protection des données - ce qui
personnelles renforcera les droits des citoyens en introduisant signifie que les garanties de protection des données seront
les règles suivantes : intégrées au sein des produits et des services, et que des
• Création d'un « droit à l'oubli » pour aider les citoyens à gérer paramètres respectant la protection des données personnelles
les risques en matière de protection des données en ligne. deviendront la norme - par exemple sur les réseaux sociaux.
Lorsque la personne concernée ne voudra plus que ses Ces règles vont renforcer les droits des personnes d'une
données soient traitées et qu'il n’existe pas de motif légitime manière pratique.
d’en maintenir le traitement, les données seront effacées. Grâce à ces règles plus strictes de protection des données,
Ces règles ont pour visée de renforcer les droits des la Commission européenne a pour objectif de contribuer à
individus. Il ne s’agit pas de supprimer des événements accroître la confiance dans les services en ligne, afin que les
passés ou de restreindre la liberté de la presse. citoyens soient en mesure d’utiliser les nouvelles technologies
• Création d'un droit à la portabilité des données personnelles avec plus de confiance en bénéficiant des avantages du marché
d'un fournisseur de service à un autre. intérieur.
• Renforcement du principe du « consentement », lequel Les autres avancées du projet de règlement sont les
lorsqu’il est nécessaire doit être donné de manière explicite. suivantes :
• Obligation mise à la charge des entreprises et des • Un seul corps de règles sur la protection des données,
organisations d’avertir sans délai injustifié les particuliers des valable dans toute l'UE.
failles de sécurité relatives à leurs données personnelles qui
• Un interlocuteur unique : les entreprises n'auront en principe
seraient susceptibles de leur nuire. Ils devront également
qu'à traiter avec une seule autorité de protection des
informer l'autorité compétente de protection des données.
données au niveau national, à savoir l’autorité compétente
• Amélioration des voies de recours administratives et dans l'État membre où elles ont leur établissement principal.
judiciaires en cas de violation des droits de protection des
• Les personnes auront le droit de se référer à leur autorité
données.
nationale de protection des données, même lorsque leurs
• Responsabilité accrue et application du principe données personnelles sont traitées en dehors de leur pays
d’accountability (« obligation de rendre compte aux parties d'origine.
prenantes ») des responsables de traitement - à travers des
• Les règles de l'Union européenne s'appliquent aussi aux
évaluations des risques en matière de protection des
sociétés non établies dans l'Union européenne, si elles offrent
données, des délégués à la protection des données et à
des biens ou des services au sein de l'Union européenne ou si
travers les principes de « privacy by design » et « privacy by
elles surveillent le comportement en ligne des citoyens.
default ».
• Des responsabilités accrues et l’avènement du principe
d’accountability pour les responsables de traitement des
données personnelles.
• Les contraintes administratives telles que les exigences de
notification systématiques pour les entreprises responsables
de traitement des données personnelles seront supprimées.
Source : Commission européenne - le projet est encore en discussion (processus de codécision entre le Parlement européen et le Conseil)
des données personnelles en tant La question de la protection des données personnelles est au
cœur du marché du Big data culturel, puisque les données
qu’actif des entreprises personnelles culturelles reflètent la personnalité d’un
individu. Le culturel, c’est la « donnée de l’intimité », pour
Les données personnelles sont aujourd’hui au cœur autant la donnée culturelle n’est pas spécifiquement
de l'innovation et de la publicité en ligne et réglementée par le droit positif (directive européenne de
constituent « un type d'actif pour les entreprises1 ». 1995) et n’est pas appréhendée par le projet de Règlement sur
la protection des données personnelles en cours de discussion
Appelées à devenir l’un des moteurs de l’économie
à Bruxelles (le vote, initialement prévu au premier semestre
numérique, elles font l’objet d’investissements 2014, pourrait être reporté en 2015 - Conseil européen, 25
massifs. octobre 2013). Par ailleurs, et c’est aussi un enjeu
fondamental, il est important que le droit reconnaisse la valeur
Paradoxalement, les outils juridiques à disposition patrimoniale de ces données.
des entreprises pour protéger et valoriser leurs Le nouveau cadre réglementaire européen en matière de
données semblent aujourd’hui trop limités pour données personnelles demeurera certainement plus ambitieux
par rapport aux règles en vigueur dans le reste du monde.
appréhender de manière adéquate cet actif
Il pourrait contribuer au développement des acteurs de Big
stratégique. data en Europe dans la mesure où il va renforcer le niveau de
sécurité et confiance apporté que les acteurs européens seront
tenus d’offrir aux individus dont ils traitent les données.
1
Competition and personal data protection, Joaquin Almunia, Vice President of the European Commission responsible for Competition Policy, Privacy Platform event: Competition and
Privacy in Markets of Data, Brussels, 26 November 2012, SPEECH/12/860
Le savoir-faire est une notion à géométrie variable, dont la La faiblesse du régime de protection du savoir-faire, des
définition peut beaucoup varier d’un pays à l’autre. innovations non éligibles à la protection par le droit d’auteur ou la
propriété industrielle est un frein à la valorisation du patrimoine
En France par exemple, il n’existe pas de définition juridique
immatériel des entreprises. Pourtant les accords ADPIC qui ont
précise de cette notion. Elle se trouve donc limitée à une valeur
pour objet de définir les règles minimales de protection de la
qui peut faire l’objet d’accords de licence ou de cession auprès
propriété intellectuelle par les pays membres de l’OMC opèrent un
de tiers souhaitant bénéficier des connaissances qu’il recouvre.
rapprochement entre secret et savoir-faire et couvrent la notion
Pour autant, elle n’est pas directement protégeable par un titre de
plus large de « renseignement non divulgué ».
propriété industriel qu’il serait aisé de défendre.
Le savoir-faire est un bien économique pouvant être valorisé dans Cette notion permet de fonder une interdiction générale
le patrimoine d’une entreprise. Mais il n’est pas un bien juridique d’usurpation et d’usage d’informations, de renseignements
et ne peut être considéré isolément comme l’objet d’un droit confidentiels ou de techniques et procédés ayant une valeur
privatif. commerciale, qui ne sont pas généralement connus et ne sont pas
aisément accessibles.
Le savoir-faire entendu comme connaissance technique
transmissible et non immédiatement accessible au public n’est Si la conception française du secret est très étroite et que des
visé par les textes que sous l’aspect pénal très particulier de la incriminations pénales ne sont retenues qu’en ce qui concerne les
violation du secret de fabrique. Or cette notion ne désigne que les secrets de fabrique, parallèlement, d’autres pays ont retenu une
seuls secrets utilisables dans le domaine de l’industrie, sous forme notion plus proche de la lettre des accords ADPIC, permettant
de méthodes, de procédés ou matières utilisées (Cass. Crim., 24 ainsi une protection plus large du patrimoine informationnel des
juin 1985, n° 83-92.873). En revanche, elle n’appréhende pas entreprises, comme par exemple :
les méthodes commerciales ou les secrets de commerce (fichiers • En I► talie : protection des informations relatives à l’entreprise
clients par exemple). et à son expérience technico-industrielle, y compris son
La valeur économique résultant des investissements effectués expérience commerciale si ces informations sont secrètes et
afin de développer un savoir-faire n’est donc protégeable que sur ont une valeur économique.
le terrain du droit commun de l’action en concurrence déloyale • A
► ux États-Unis : protection des informations financières
ou en parasitisme, qui sont susceptibles de révéler deux types de économiques ou commerciales.
difficultés :
• L
► a nécessité de faire la preuve d’une faute, d’un préjudice et
d’un lien de causalité entre la faute et le préjudice (à l’inverse la
violation d’un droit de propriété intellectuelle qui ne requiert
que la preuve de l’existence du droit et de l’acte de violation).
• L
► ’octroi de dommages-intérêts ne couvrira que très rarement
l’intégralité des préjudices subis par le titulaire du savoir-faire
et cela d’autant qu’une fois le savoir-faire divulgué, il perdra
une grande partie de sa valeur et ne bénéficiera plus d’aucune
protection.
Une logique de droit d’auteur pour valoriser les actifs résultant des données personnelles
Outre la question de la protection purement juridique, plusieurs Pour mémoire, le droit d’auteur présente deux composantes
réflexions ont été menées à un niveau gouvernemental sur la distinctes :
distorsion existante entre la valeur réelle et la valeur comptable • D
► es droits moraux d’autoriser ou d’interdire la diffusion
des données personnelles. d’une œuvre.
Du point de vue des États, cette distorsion crée aujourd’hui un • Des droits patrimoniaux garantissant aux auteurs une juste
obstacle du point de vue de la fiscalité des GAFA dont le modèle rémunération au titre de l’exploitation commerciale de leurs
économique repose essentiellement sur l’exploitation des œuvres.
données de leurs utilisateurs et dont les profits ne sont pas Sur cette base, le rapport propose de reconnaître la composante
toujours correctement appréhendés par les États où leurs patrimoniale des données à caractère personnel en permettant
services sont distribués. aux personnes concernées d’appréhender la valeur réelle des
Nicolas Collin et Pierre Colin, les auteurs du rapport sur la données les concernant comme contrepartie des services
fiscalité du numérique, proposent de calquer la protection des « gratuits » disponibles sur Internet pour le grand public.
données personnelles sur le régime du droit d’auteur. La composante droit moral serait, quant à elle, calquée sur la
réglementation en matière de protection à caractère personnel.
Ainsi, les entreprises qui pourraient démontrer le respect de la
loi Informatique et Libertés, pourraient bénéficier de
l’application d’un taux de fiscalité réduit. • En savoir plus p. 37
1 Décision de la Commission européenne du 11 mars 2008 déclarant une opération de concentration compatible avec le marché commun et le fonctionnement de l’accord EEE,
Affaire n° COMP/M.4731 - Google/DoubleClick
2 Commission européenne, Affaire n° COMP/M.5727 – Microsoft/Yahoo! Search Business, 18/02/2010, §100
3
Personal data, will Competition Law collide with privacy? – Competition law and personal data: Preliminary thoughts on a complex issue, D. Geradin and M. Kuschewsky,
Concurrences n° 2-2013
Dans le cas de la fusion entre Google et Doubleclick, la Commission européenne a examiné l'effet de
l’accroissement de la quantité de renseignements personnels obtenus par l'entité issue de l’opération.
Dans ce cas, « l'enquête a révélé que la combinaison des informations sur les comportements de recherche
et le comportement de navigation web ne donnerait pas un avantage concurrentiel dans le secteur de la
publicité tel qu’il ne pourrait être reproduit par d'autres concurrents qui ont accès à des données
d'utilisation du web similaires ».
Si cet élément a bien été pris en compte dans l’analyse de l’opération de fusion impliquant notamment
Google, il n'a pas abouti ici à la conclusion que la fusion pourrait avoir un effet anticoncurrentiel.
4 Ces accords d'exclusivité « sont susceptibles d’exclure les concurrents sur le marché, surtout quand ils sont conclus par des entreprises en position dominante », et a fortiori si un
ensemble d’accords de cette nature a été conclu
5 roposal for a regulation of the European parliament and of the council on the protection of individuals with regard to the processing of personal data and on the free movement of such
P
data (General Data Protection Regulation), 2012/0011, 25/01/2012
1 «
Données personnelles, le droit de la concurrence doit-il prendre en compte la protection de la vie privée ? – Le point de vue de l’Autorité française de la concurrence », Bruno Lasserre,
Président de l’Autorité française de la concurrence, Concurrences n° 2-2013, p. 28
2 Modèle d’affaires adossant une activité dite « gratuite » à une activité rémunérée, localisée le plus souvent dans des territoires différents
3 Nicolas Collin et Pierre Colin, Mission d’expertise sur la fiscalité de l’économie numérique, janvier 2013
1 Taxe sur les recettes publicitaires proposée par M. Le Sénateur Marini (France) dès 2010
2 Taxes sur les téléphones mobiles intelligents préconisées par le Rapport de la Mission Lescure en 2013 (France), mais non retenues par le gouvernement français
3 Par exemple : niveau d’information de l’utilisateur sur ses droits à la protection des données personnelles, recueil de consentement et facilité de l’exercice de ses droits via l’interface,
ouverture à la concurrence et nouveaux services, accès des données à des tiers, etc.
Anticipation utilisateur
Comportement
Session utilisateur • Non création de comptes
• Données de contact (âge, sexe, coordonnées…)
• Moteur de recherche • Données de connaissance (CSP, intérêts, relations, utilisateurs (rarement possible)
• Messagerie profil de consommation…) • Non utilisation des nouveaux
• Site tiers services online/ cloud (de moins en
• Réseau social moins possible)
• Automodération (réseaux sociaux)
Source : EY ©
| 39
Opposer le principe de précaution au Big data :
un risque réel pour l’innovation
La thermodynamique
La thermodynamique, qui a permis le développement de Cette efficacité de l’analyse macroscopique réside dans le fait
l’industrie du XIXe siècle en basant ses analyses uniquement qu’un grand nombre d’états microscopiques sont possibles
sur des indicateurs « macro », vise à comprendre les pour un même état macroscopique. Aussi, la température est
échanges d’énergie et de chaleur. la résultante d’un niveau d’agitation de molécules, qui peuvent
se trouver dans des milliards de configurations possibles pour
Elle est riche en applications pratiques que nous utilisons
une même mesure de la température.
tous les jours : moteurs, réfrigérateurs, turbines ou encore
réacteurs. Les modèles ont besoin de très peu de grandeurs Ainsi, la thermodynamique nous enseigne que l’on est capable
pour décrire le comportement des systèmes et leur évolution, de prendre des décisions sur la base d’une mesure d’un
principalement Entropie, Température, Pression, Volume. indicateur « macro » comme la température sans pour autant
avoir besoin de mesurer toutes les grandeurs au niveau
L’efficacité de ces prédictions macroscopiques est tout à fait
« micro » (positions, mouvements des milliards de molécules
étonnante quand on sait qu’au niveau microscopique, ces
à l’origine du niveau de la température). Par exemple, il est
comportements sont la résultante des particules composant
possible de pasteuriser du jus de pomme en maintenant une
les gaz et les liquides et que chaque particule est définie a
température de 75° . Pour ce faire, il n’est pas nécessaire
minima par son vecteur vitesse (3 données) et sa position
de modéliser ce qui se passe au niveau de chaque molécule
(3 données) soit des milliards d’informations nécessaires.
(niveau « micro »).
Par analogie avec le Big data, il est possible de prendre On pourrait imaginer que les grandeurs de mesures sont
des décisions en analysant les comportements « macro » « macro » et très précises pour permettre une adaptation
d’un groupe d’individus sans avoir besoin d’identifier parfaite à la demande. Cependant la demande, grandeur
parfaitement le comportement intime de chacun. macroscopique, est la résultante de nombreuses demandes
A-t-on besoin de tout connaître de M. ou Mme X pour faire des individuelles (microscopiques) qui peuvent rester anonymes.
prédictions sur une population de grande taille ? En d’autres Le retour au niveau « micro » pour l’acte d’achat peut
termes, est-il nécessaire d’associer la somme d’informations s’analyser de la même façon : une campagne de publicité avec
collectées à une personne clairement identifiée (nom, les bons messages envoyés à la population idoine pourrait
adresse…) afin de lui proposer de façon plus adaptée certains s’avérer plus efficace qu’un envoi ciblé personnel.
produits ?
Big data et respect de la vie privée peuvent être conciliables dans un environnement
réglementé et sécurisé.
Source : EY ©
La physique quantique
La physique nous enseigne que l’analyse microscopique,
domaine de la physique quantique du XXe siècle, est La génomique
aléatoire par nature et que la précision infinie de la mesure
est vaine (on ne peut connaître en même temps la position Si la cartographie du génome d’un individu ne permet,
et la vitesse d’une particule). au niveau « micro », que d’émettre des probabilités de
Enfin, à ce niveau, l’observation interfère avec l’expérience. réalisation (maladies, etc.), au niveau « macro »,
En d’autres termes, l’observation modifie le comportement la combinaison de ces probabilités individuelles permettra
des particules. de révéler, sur une population de grande taille, les risques
et opportunités réels, justifiant ainsi des investissements
d’ampleur permettant d’améliorer la santé des individus
Par analogie avec le Big data, il en ressort que (R&D, vaccins, traitements).
l’observation « microscopique » d’un individu modifierait
son comportement. Lorsqu’une personne se sait
« observée », elle tend à modifier son comportement, On peut comprendre que si l’on respecte la confidentialité
rendant ce dernier moins prédictible. des décryptages individuels permettant, par leur
D’où l’importance d’un environnement sécurisé, de combinaison, d’aboutir à des découvertes et des décisions
confiance, afin que les individus se sentent libres et d'investissement, l’équilibre entre progrès et respect de
décisionnaires de leurs comportements et ne soient pas la vie privé est atteint.
réticents à échanger ou communiquer leurs données.
Depuis l'ouverture en 2011 du portail data.gouv.fr, le ministère De nombreuses applications s’appuyant sur les données
de la Culture et de la Communication s’attache à recenser culturelles ouvertes existent déjà :
et mettre à disposition des développeurs différents jeux • Les cartes interactives, comme le module développé par le
de données tels que la liste des établissements publics ministère de la Culture et de la Communication représentant
culturels géolocalisés et de leur offre éditoriale, les données l’ensemble des lieux culturels français sous forme de galaxie,
de la médiathèque de l'architecture et du patrimoine ou Cartographone, carte regroupant les lieux de tournage de
(liste des immeubles protégés au titre des monuments film à Paris.
historiques, liste des objets mobiliers propriété publique
• Les interfaces de visualisation de données, avec par exemple
classés au titre des monuments historiques), ou encore
un article du journal Le Monde contenant un module
une trentaine de jeux de données du Centre national du cinéma
permettant de visualiser de façon interactive les statistiques
et de l’image animée (CNC), comme par exemple les recettes à
de consultation des ouvrages dans les bibliothèques
l’international des films français ou la liste des établissements
parisiennes.
cinématographiques. De nombreuses villes et régions ont quant
à elles initié l’ouverture des données publiques, qui peuvent être • Les applications utilitaires, permettant par exemple de
des statistiques démographiques (anonymisées), aussi bien que trouver la bibliothèque la plus proche, des informations sur
la liste des lieux de tournage de film et les statistiques de les musées de la ville (comme Musambule à Marseille), ou
consultations d’ouvrages en bibliothèques. encore des agendas culturels multi-éditeurs (tels que Cibul
en région PACA).
L’ouverture de ces données, croisées avec les centres d’intérêt
• La visite augmentée : comme Culture Clic, proposant non
d’individus ou de communautés, représente non seulement
seulement des informations pratiques sur les musées français
l’opportunité de développer de nouveaux services et usages,
mais aussi un catalogue de 900 œuvres visualisables en
mais aussi de faciliter la promotion et l’accès à la culture.
réalité augmentée.
• Les producteurs de données : ils constitueraient • Les opérateurs d’infrastructures du Big data :
de véritables bases de données fiables qui, nouveaux acteurs du numériques, opérateurs de
grâce à leur capital confiance, pourraient être télécommunications…
revendues à des tiers. • Les gestionnaires d’infrastructures : ils pourront
• Les agrégateurs de données : ils agrégeraient, louer, en plus de leurs capacités de stockage,
croiseraient et contextualiseraient ces données des capacités de calcul à des sociétés ayant des
à des fins d’analyse. besoins ponctuels en matière de traitement de
• Les utilisateurs de données : ils développeraient, Big data.
à partir des analyses obtenues, des nouveaux • Des acteurs de confiance s’assurant du maintien
services et nouvelles applications. Ces utilisateurs de l’intégrité/qualité des données, depuis leur
peuvent être des entreprises de média et des sourcing jusqu’à leur utilisation, rassurant ainsi
start-up développant des applications spécifiques utilisateur et consommateur finaux. Cette phase
et ciblées pour ces groupes de média ou des est indispensable pour garantir, par exemple, que
établissements culturels (application dédiée en la version électronique d’une œuvre, téléchargée
marge de l'exposition Hopper au Grand Palais). en ligne (e-book) corresponde à l’œuvre originale.
Producteurs de data
Agrégateurs de data Utilisateurs
(exemples)
Acteurs des
Infrastructures Infrastructure Big data
de données
Où et comment se positionner
Les champions du numérique et les entreprises culturelles vont chercher à étendre leur présence au sein de la chaîne de valeur de la
data, horizontalement (de la production à l’utilisation de la data) et/ou verticalement (de l’infrastructure Big data aux services destinés
aux utilisateurs et clients finaux). Ils procéderont par croissance interne ou externe, par des alliances avec des pure players, etc.
Des business models (pure players) et univers de services innovants vont émerger/se développer :
• Le Sourcing (producteur de données fiables).
• La spécialisation dans le développement de services et d’applications mobiles ultra-ciblés (exemple du marché du jeu vidéo mobile).
• La certification et l’audit liés à la sécurisation des données tout au long de la chaîne de valeur, pour répondre aux exigences de
transparence et de confiance des consommateurs et utilisateurs, mais aussi prévenir le risque de réputation.
+
Source : EY ©
Big data
Bang
Producteurs de data
Établissements culturels,
exploitants de salles,
librairies
Collecte, stockage
Collecte, et mise
stockage, à disposition
calcul,
(réseau,
mise capacités...)
à disposition
de capacités
Acteurs de confiance
Réglementation
Sécurisation
Certification
Emploi Innovation
(4,4 millions d’emplois
créés d’ici 2015)
Cette étude a été réalisée par EY, sous la direction de Bruno Perrin,
Fabrice Naftalski et Régis Houriez, avec la participation de Marie-Pierre
Bonnet-Desplan, Solenne Blanc, Vincent Placer, Louisa Melbouci,
Pierrick Vaudour, Guillaume Marcerou, Sébastien Bardou, Aurèle
Tabuchi, Colin Garnier, France de Roquemaurel à la rédaction et
Sandrine da Cunha au graphisme.