big data

Big Data : une introduction

Commencez

 

« Bien commun » ? Les données s’intéressent donc à ce qui est et présentent un monde déjà existant à travers un prisme d’efficacité technique où le référentiel central devient l’optimisation de cet existant. Dans ces conditions, la logique probabiliste que le « monde des BD » charrie marquerait-elle la fin des « temps modernes » et le début d’une nouvelle phase déterministe dans l’histoire des hommes ? Que dire, en outre, d’une possible addiction aux « univers probables » et aux jeux de comparabilité qu’ils induisent exclusivement sinon qu’ils ruineraient la possibilité même d’univers originaux, non encore imaginés et leur incomparabilité nécessaire ? Comment, en effet, le « bien commun » accueillerait-il encore l’original, le non encore conçu, l’informulé, le non pratiqué,…? Faut-il veiller à promouvoir au service de l’action tout à la fois et la qualification et la « disquantification »? Par ailleurs, la logique macro de « gestion des risques et des opportunités » – qui, via les BD, s’accroche à tout aujourd’hui ! – va-t-elle transformer celle de « responsabilité individuelle » ? Et la carte l’emportera-t-elle sur le territoire ? Autre grande question, celle de l’espace public. Qu’est-ce qu’un espace public où… la publicité n’a aucun coût ? Serait-il le lieu d’un néo-benthamisme triomphant où les Big Data offriraient au plus grand nombre la meilleure voie dans la poursuite du plus grand bonheur ? (Et, bien entendu, quel rôle des Etats, là-dedans ? (11) ). Doit-on prévenir les effets d’un renforcement de la « gouvernementalité par les nombres », par les algorithmes ? Doit-on anticiper un espace public déserté d’une « connaissance publique » jusque-là appuyée sur les organismes chargés de la statistique publique ? Revenons un instant à Morozov : « une réglementation algorithmique » consacrera-t-elle « la prise de pouvoir des données et la mort de la politique » ? En effet, dit-il, « le désaccord et le conflit, selon ce modèle, sont considérés comme des sous-produits malheureux de l’ère analogique – à résoudre par la collecte des données – et non comme les conséquences inévitables de conflits économiques ou idéologiques » (12). Last, but not least, qu’est-ce qu’un espace public où les sciences, sociales notamment, seraient in fine portées à faire écho avant tout à toutes les formes possibles d’utilisation des données du Web ?

« Vivre-ensemble » ? La question de la protection des données individuelles et collectives contre le vol ou la malveillance constitue une thématique importante et pertinente, médiatiquement très explorée : en effet, aujourd’hui, les données personnelles n’ont toujours ni propriétaires ni règles d’usage, en particulier sur la façon d’envisager « la gestion de la mémoire » ! Elle pose, en outre, de redoutables problèmes de libertés comme l’a montré, au début des années 2000, la forme de la réponse américaine d’un « Patriot Act » pour assurer la sécurité (13) !
Plus généralement, si la tendance devait aller à la colonisation progressive de nos choix à base de sens moral par des algorithmes prédictifs, comment échapper alors à la violence des échelles industrielles et des diktats collectifs, quels que soient leur forme (Gosplan capitaliste, société autoritaire de marché,…), qui pourrait en être le corollaire (14) ? Comment préserver un libre « pouvoir d’agir » individuel et collectif face à la menace d’une dictature des données, le cas échéant guidée par une « industrie bibliométrique » fortement concentrée ? Suffirait-il d’adopter des principes de transparence (des données et des algorithmes), de certification (fiabilité et validité des algorithmes) et de réfutabilité (possibilité de réfuter une prévision) ?

Bref, quel contrôle, quelle maîtrise à propos de la gouvernance des BD ? Autorégulation par les marchands ? Ou bien régulation publique fondée, par exemple, sur une redéfinition d’ensemble du numérique autour d’un principe général de loyauté, comme semble le recommander le CNN (Conseil National du Numérique) ? Peut-on envisager également la conception d’une maîtrise citoyenne des BD ? Alex Pentland (15) laisse entendre avec optimisme qu’un « contrat social sur les données » est possible. Mais le développement de bases et banques de données techniquement sous contrôle individuel ou mutuel est-il à l’échelle des enjeux ?  L’open innovation ne servira-t-il pas les intérêts des entreprises plutôt qu’une « société civile informée », même par des « données brutes »? Enfin, en quoi des lois antitrust suffiraient-elles pour protéger contre les « détenteurs de données », et le pouvoir asymétrique dont ils disposent ?

En guise de conclusion (provisoire) à cette introduction

Instruments, outils, dispositifs, terrains d’enquêtes, métiers, industries en émergence,…Les mégadonnées ou « Big Data », nouveau jalon de la dite « société de l’information », interrogent donc nos représentations, nos façons de penser et de réfléchir, de croire et de valoriser ; elles les modifient ; elles modifient aussi nos autres instruments et outils. Enfin, elles modifient nos façons d’envisager l’action en général, nos anticipations, nos démarches, nos intentions, nos décisions, nos usages : l’action économique, l’échange et la transmission, et l’action politique, sa rationalité, son organisation. Les BD illustrent l’irruption d’un univers nouveau fait de cartes, de comptes, de sites… qui créeront de l’autorité et de la norme et où nous pourrions avoir tendance à détacher « les traces nativement digitales » de leurs conditions de production, pourtant souvent auto-référentielles (16) !

Pourquoi ne pas profiter d’une lecture illimitée de UP’ ? Abonnez-vous à partir de 1.90 € par semaine.

La « performativité » marque la capacité de glissement du prédictif au prescriptif. Celle des BD, que nous avons tenté de caractériser sous de nombreux angles de vue, apparaît inédite, inouïe et durable parce que mise au service de logiques puissantes, avant tout économiques, mais aussi militaires. Or, dans moins de 10 ans, le monde pourrait être et la source et le produit d’un univers peuplé de 100 ou 200 milliards d’objets connectés, dont…9 milliards d’hommes ! Le cas échéant, – Big Data aidant – il pourrait n’être plus que la projection de l’extension du domaine des mathématiques en laboratoire, illustrant la prise de pouvoir du in silico sur le dialogue séculaire entre le in vitro et le in vivo.

 

Jean-Paul Karsenty, Cetcopra – Paris 10 février 2015

(1) Le Journal officiel de la République française du 22 août 2014 publie l’avis de la commission générale de terminologie et de néologie : il faudra dire désormais mégadonnées et non Big Data. Pour la commission, les mégadonnées sont des données structurées ou non dont le très grand volume requiert des outils d’analyse adaptés.
(2) Logiquement, elles ne s’intéressent pas à ce qui n’est pas enregistré ; a fortiori, elles ne sauraient considérer ce qui n’est pas enregistrable ou, en outre, ce qui n’existe pas. Retenons ceci, car cela a des conséquences souvent négligées dans nos raisonnements et nos démarches d’action. Mais on y reviendra.
(3) GPS américain et, sauf nouveaux ennuis, Galileo européen à compter de fin 2015.
(4) Enregistrer est une opération dont les effets sont de grande portée. Elle accepte « le désordre naturel du monde » et elle renonce de fait à la précision sémantique pour pouvoir bénéficier des effets du processus d’intégration qu’elle autorise entre photos, videos, texte, musique.
(5) L’article s’intitule précisément : « The End of Theory : The Data Deluge Makes the Scientific Method Obsolete ». Chris Anderson est physicien et journaliste américain, ancien Rédacteur en chef de Wired, magazi-ne techno-utopiste libertarien.
(6) On peut aisément montrer qu’en agissant sur les conditions de la décision en général, elles peuvent, dans certains cas et dans des limites claires de leurs conditions d’utilisation, servir l’intérêt général, civique ou civil. Mais restons-en, pour l’instant, à leur valeur économique illustrée par l’émergence d’un nouveau et gigantesque marché créé par et pour les entreprises.
(7) Une valeur d’option pour les données, c’est l’estimation a priori d’une sorte de « vraie valeur » qu’on ne pourrait mesurer dans l’absolu qu’ex post, c’est-à-dire en tenant compte de toutes les utilisations successives effectuées des données ou de leur capacité d’extensibilité à des multiples utilisations potentielles.
(8) Un « technomarché » à foyer chinois est-il en train d’émerger autour de Alibaba, de Baïdu ou de Xiaomi ?
(9) « Il faut une concurrence équilibrée. Mais tant que Google peut éteindre un concurrent d’un seul coup d’algorithme, c’est que cela ne va pas. Il faudra demander le dégroupage de Google, si la compétition n’est pas ouverte et équitable. ». Denis Olivennes, président du Directoire de Lagardère Active, le 15 mai 2014, Cité Universitaire, Paris.
(10) La prise de pouvoir des données et la mort de la politique », Evgeny Morozov publié le 20/07/2014 dans The Observer, traduit par Guy Weets et repris sur son Blog par Paul Jorion le 25 août 2014
(11) Bernard Harcourt, Université de Chicago et EHESS, rapporte qu’il n’en coûterait que 20 millions de dollars par an au Gouvernement américain pour « accéder aux données de Microsoft, Yahoo, Google, Facebook, You Tube, Skype, Apple, et d’autres » par l’intermédiaire du fameux programme PRISM de la NSA, lancé en 2007 (Intervention au Colloque du Collège de France, le 2 juin 2014). Au nom d’un principe d’Open data, irait-il le cas échéant, jusqu’à « libérer » toutes les informations en provenance des entreprises qu’il aura acquises pour une bouchée de pain ?
(12) Article cité.
(13) …La sécurité américaine dont Edward Snowden a révélé en 2013 des dimensions inconnues jusque-là. Parmi les dernières dévoilées, « MoreCowBells » est un programme de l’Agence nationale de sécurité (NSA) présenté comme « de surveillance passive » qui entre en possession d’une masse de métadonnées sur le trafic Internet qu’il peut croiser avec d’autres types de métadonnées collectées par ses programmes de surveillance : qui communique avec qui, quand, combien de fois, etc… (in le Monde, 25 et 26 janvier 2015, page 8)
(14) Le Conseil d’Etat a produit (09/09/2014) une volumineuse réflexion (400 pages) sur le sujet de l’encadrement souhaitable des algorithmes prédictifs.
(15) Alex Pentland, Professeur des arts et des sciences des medias au MIT (in le Monde, 31 mai 2014)
(16) J’emprunte la formule et le raisonnement qui l’accompagne à Dominique Boullier, lequel décrit surtout dans une intervention au Collège de France, le 2 juin 2014, les enjeux pour la 3è génération de sciences sociales qui s’annonce, et les démarches idoines pour les considérer.

Références
« Big data, entreprises et sciences sociales – Usages et partages des données numériques de masse », Pierre-Michel Menger (Chaire de sociologie du travail créateur 2013-2014), Collège de France, Colloque du 2 juin 2014 (avec 3 sessions : 1/ « Big data », entre usages instrumentaux et usages académiques : un panorama des évolutions ; 2/ « Les « Big data » comme terrain d’enquêtes en sciences sociales » ; 3/ Les « Big data », nouvel outil de recherche en sciences sociales ? »).
« Big Data – La révolution des données est en marche », Victor Mayer-Schönberger et Kenneth Cukier – ouvrage traduit de l’anglais (Etats-Unis) et paru chez Robert Laffont – janvier 2014
« Eléments de débat sur le rôle des Big Data dans la recherche scientifique – Autour de « The end of theory » de Chris Anderson », Anne Alombert, doctorante à Paris 1, article à paraître
« Peut-on créer un écosystème français du Big Data ? », François Bourdoncle, in Le journal de l’Ecole de Paris du Management, n° 108, juillet/août 2014
« Des données sans personne : le fétichisme de la donnée à caractère personnel à l’épreuve de l’idéologie des Big Data », Antoinette Rouvroy, juillet 2014
« Pour tout résoudre, cliquez ici – l’aberration du solutionnisme technologique – », Evgeny Morozov, traduction de Marie-Caroline Braud, Editions Fyp, septembre 2014
« Les marches de l’aléa », Michel Armatte, Prisme n°21, février 2012, Centre Cournot pour la Recherche en Economie
La Revue du Digital de « l’info du Business Connecté », plusieurs n°.
Un « Guide des utilisateurs 2014 du Big Data 2014/2015 – L’annuaire de référence à destination des utilisateurs – », réalisé par la société Corp (que m’a signalé Françoise Roure)

 

in
Article précédent

La Peur. Raisons et déraisons

temps marranes
Prochain article

La troisième mort de celui qui ne voulait pas être prophète

Derniers articles de Analyses

REJOIGNEZ

LE CERCLE DE CEUX QUI VEULENT COMPRENDRE NOTRE EPOQUE DE TRANSITION, REGARDER LE MONDE AVEC LES YEUX OUVERTS. ET AGIR.
logo-UP-menu150

Déjà inscrit ? Je me connecte

Afin de contribuer à l’effort d’information sur la crise actuelle du coronavirus, UP’ propose à ses lecteurs un accès gratuit aux derniers articles publiés relatifs à cette thématique.

→ Inscrivez-vous gratuitement pour poursuivre votre lecture.

Créez votre compte gratuit pour continuer votre lecture





En vous inscrivant, vous acceptez nos conditions générales d’utilisation
ainsi que notre charte de confidentialité

REJOIGNEZ

LE CERCLE DE CEUX QUI VEULENT COMPRENDRE NOTRE EPOQUE DE TRANSITION, REGARDER LE MONDE AVEC LES YEUX OUVERTS ET AGIR

Vous avez bénéficié de 3 articles gratuits pour découvrir UP’.

Profitez d'un accès illimité à nos contenus !

A partir de 1.70 € par semaine seulement.