A quoi rêvent les sociologues des algorithmes? edit

10 février 2016

Internet semble le terrain idéal pour mettre à nu la société, un lieu d’objectivation parfait : les internautes laissent de multiples traces, les opérateurs peuvent suivre leur navigation (plus ou moins légalement) et à partir de calculs à grande échelle (les big data) repérer les comportements prédictifs. « Big Brother is watching you » : cette vision, c’est celle véhiculée par l’individu moyen, confortée par les critiques de type Apocalypse Now qui se sont abattues sur la culture numérique. Cette vision, pourtant, c’est celle d’avant. Avant que Dominique Cardon n’ouvre la boite noire dans A quoi rêvent les algorithmes? (Le Seuil, octobre 2015). Son livre offre un éclairage sur les secrets algorithmiques qui guident nos navigations : y a-t-il matière à faire des cauchemars et à passer des nuits blanches ?

Le sociologue identifie quatre familles d’indicateurs des traces laissées par les internautes : l’audience des sites, dénombrée par le nombre de clics ; ensuite, la construction d’une autorité des sites établie par l’algorithme de PageRank de Google qui en évalue la force sociale en fonction des liens hypertextes qui se réfèrent à eux : « les sites les mieux classés sont ceux qui ont reçu le plus de liens hypertextes venant de sites qui ont, eux-mêmes, reçu le plus de liens hypertextes des autres » ; puis, la popularité de chaque internaute, sa réputation et sa capacité d’influence en fonction du nombre d’amis, d’informations publiées, des « like », des contenus commentés ou partagées ; enfin, les traces que laisse l’internaute par ses navigations et qui permettent de cerner son profil et de l’associer aux comportements des usagers qui lui ressemblent (techniques du machine learning), ouvrant alors une voie prédictive à ses comportements futurs.

Il fait valoir combien les données collectées sont imprécises ou peuvent être faussées par les actes volontaires des internautes ou des services experts en stratégie communicationnelle qui sont offerts à tous les acteurs du Net pour accroître leur visibilité ou leur efficacité. Sur le clic d’audience : le profil de celui qui actionne l’ordinateur familial est opaque ; compte tenu de la circularité vertigineuse des internautes, un clic n’a aucunement la valeur d’une information vue ou lue ; le nombre de sites est si abondant que seuls certains d’entre eux, centraux et populaires, peuvent être classés ; en l’absence d’un régulateur du secteur, la manipulation des chiffres d’audience est aisée et d’ailleurs « les chiffres diffèrent sensiblement selon les instituts ». Sur la dynamique d’autorité posée par PageRank : on peut améliorer son classement en usant de diverses techniques (Search Engine Optimization), et de fait prospère tout un marché d’entreprises aidant à l’amélioration du référencement ; sur les métriques de réputation, on repère des virtuoses aptes à doper leur notoriété, à élargir et animer leur communauté, et susciter des phénomènes de communication virale autour de leur personne ; cet art de la manipulation est encore plus prégnant quand il s’agit du secteur des services, notamment dans la restauration et l’hôtellerie. Enfin, les outils prédictifs de comportements grâce aux collectes de big data sont accompagnés de pratiques publicitaires occultes par le biais de cookies : grâce à un mouchard, l’ensemble des sites publicitaire affiliés à une régie connaitront les informations de navigation d’un internaute, et pourront alors réinjecter un même message commercial adapté à lui sur d’autres sites qu’il visite. Mais pour contrecarrer les ciblages publicitaires de plus en plus sophistiqués, des fonctionnalités ont été mises au point par les navigateurs qui permettent de bloquer la publicité : 40 % des internautes allemands y ont recours, 30 % en France.

Ainsi, une multitude d’experts en stratégie numérique, jouant du réseautage, des cookies et des robots cliqueurs offre des aides pour améliorer les performances des acteurs économiques et notamment pour étendre et renforcer le ciblage publicitaire (voir par exemple la description de la technique du real-time bidding). Mais d’autres services surviennent aussi pour aider les internautes à s’y dérober. A la lecture de cette partie du livre, il apparaît que, même si la lutte est inégale, la course entre les internautes, d’une part, et les algorithmes qui cherchent à les traquer et orienter leurs comportements, de l’autre, opère un mouvement sans fin. Dans l’espace numérique, les tensions entre le marchand et le non marchand, entre le producteur qui cherche à vendre et le consommateur qui tente de protéger son autonomie ressemblent à ce qui se passe in Real Life.

Par delà cette course effrénée en faveur de la visibilité et du ciblage, Dominique Cardon met en évidence les dérives auxquelles conduisent certains choix algorithmiques. Par exemple, celui de PageRank : l’agrégation du jugement par les pairs pour classer les sites conduit, par l’accumulation de jugements croisés (les uns et les autres se citent mutuellement), à « des effets d’exclusion et de centralisation de l’autorité ». Cités en toutes circonstances, certains noms ou certains sites gagnent une popularité exceptionnelle par le nombre de clics qu’ils reçoivent : « l’aristocratique mesure d’autorité s’abime alors en une vulgaire mesure de popularité ». D’autre part, la mesure d’autorité favorise les internautes (intellectuels, politiques ou « influenceurs ») qui publient des documents liés à des liens hypertextes -comme les dirigeants de sites ou de blogs- ce qui met mécaniquement à l’écart ceux qui ne participent pas à cette frénésie numérique. Remarquons que ces mêmes phénomènes sont souvent reprochés à certains intellectuels médiatiques, plus « reconnus » par leur présence sur les plateaux de télévision que par l’intérêt scientifique de leurs recherches.

L’auteur bifurque ensuite vers une réflexion sur les sciences statistiques et s’interroge sur l’apport des données numériques au bénéfice d’une meilleure connaissance du monde social. Comment mettre à plat la société dans un contexte où chaque individu cultive sa singularité, se dérobe aux catégories statistiques, et prouve une volatilité dans ses actes et ses opinions ? Les big data issus de la physique des grands nombres, ces calculs à macro échelle à partir des traces des internautes, cette méthode est apparue comme le graal de la statistique. Cherchant des corrélations tous azimuts sans questionner les causes d’un événement, ils « ne vont plus de la cause vers la conséquence, mais de la conséquence vers une estimation des causes probables ». Plus besoin d’explication aux phénomènes sociaux, juste des faits. Surtout, cette évolution marque un changement dans la finalité statistique ; ce qui compte est moins la connaissance approfondie du social que l’action sur le réel, les indicateurs de performance constituant alors moins une clef de lecture qu’un outil pour orienter les conduites. Cette instrumentalisation des chiffres s’accélère en raison de l’action des grandes entreprises devenues propriétaires de méga bases de données et qui les utilisent à leurs propres fins. Mais ceci est aussi le fait des administrations publiques qui s’en servent pour définir ou ajuster des politiques.

Même ramenées à des fins utilitaires, cette collecte de données et cette obsession des corrélations sont prises en défaut. Un chapitre entier signale une multitude de petites défaillances ou imperfections dans la captation et le traitement des données, qui au final, suggère que le colosse des big data semble doté de pieds d’argiles. Les machines calculatoires ne seraient pas intelligentes, le pouvoir remonte à qui est apte à établir les bonnes conventions pour traiter et interpréter les données ; ces dernières souvent sont vagues, « prolixes et sans contexte ». Elles sont souvent aussi pleines de bruits (un signal parasite qui empêche de bien interpréter). Tout cet appareillage aboutit alors à des résultats décevants. Les algorithmes sont habiles à retrouver ce que l’on sait déjà, car ils s’appliquent à suivre nos traces routinières, nos habitus, et ils imputent notre futur en le calquant sur notre passé : au final, « la plupart du temps, les prédictions algorithmiques ne font que confirmer, des lois sociales bien connues ». De surcroit, les calculs sont biaisés car ils survalorisent les comportements des internautes les plus actifs, ceux qui déploient de magnifiques stratégies au sein de la Toile. Enfin attachées à saisir les grandes amplitudes sur un bref moment, les machines ont du mal à suivre les mouvements d’opinion de fond et enregistrent plutôt les pics d’activité (ex : lors d’une catastrophe).

Dominique Cardon accumule les preuves de l’invasion des métriques dans notre quotidien, et il en montre les défaillances et les insuffisances. Ce faisant, les deux conclusions auxquelles aboutit son livre, très en aplomb du texte, surprennent.

Première conclusion : sur l’accroissement des inégalités. Il remarque qu’à l’ombre de la liberté individuelle prétendument galvanisée par Internet, se déploie une société dirigée par le haut, centrée sur les modèles culturels propres aux détenteurs d’autorité, habiles à faire perdurer la hiérarchie des légitimités d’excellence. Les inégalités de tous ordres et en particulier des ressources se sont installées : d’un côté des gagnants individualisés, de l’autre, des perdants « invisibilisés ». On peut s’interroger : la communication numérique est-elle le vecteur principal de ces phénomènes ? Cette situation est-elle imputable à des machines calculatrices et à une prise de pouvoir des métriques ? Certes, la culture digitale et l’économie numérique recomposent des inégalités (notamment culturelles), mais pour saisir les fortes disparités d’aujourd’hui, ne doit-on pas surtout diriger le regard vers d’autres logiques, plus larges, plus puissantes, par exemple, dans le cas français, la sélection des élites, la désindustrialisation ou même le rôle des vieux médias. Cette cyber centralité qui orchestrerait tous les maux de la société n’est-elle pas un fantasme ?

Seconde conclusion, empreinte d’optimisme : sur l’individualisme expressif. Il pointe l’essor d’une culture de la subjectivation et d’une sociabilité enrichie par les réseaux sociaux, ainsi qu’une capacité de mobilisation culturelle ou politique donnée aux individus. En fin de compte, il affirme que les internautes « sont plus vagabonds, diversifiés et stratèges que ne le pensent ceux qui raisonnent depuis une plateforme ». Il les incite à se rebeller contre les machines. Et il remarque qu’« il serait plus judicieux de considérer le couple humains machines comme un couple qui ne cesse de rétroagir et de s’influencer mutuellement ». Or, cette dynamique croisée, c’est exactement ce qui ressort de la lecture du livre. Les individus ne semblent pas disposés à se laisser accabler par les métriques.

Cette conclusion en deux temps suggère une question : à quoi rêvent les sociologues ?