Rhodi Marsden Publié le 8 mars —Services 360° et Transversales —The Independent Londres, Courrier international.
C’est un miracle de la technologie moderne”, assure Sid Bliss, patron d’une agence matrimoniale joué par Sid James, dans Carry On Loving [comédie britannique de 1970]. “Tout ce que nous faisons, c’est fournir l’information à cet ordinateur, et quelques minutes plus tard la dame qui vous convient ressort par ici”, poursuit-il, montrant une fente.
L’étonnement du client quant à la taille de la fente, bien trop petite pour laisser passer une femme, constitue une blague prévisible [c’est bien sûr la fiche de l’intéressée et non la personne, qui sort de la machine]. Toujours est-il que le jeune client est très impressionné par cet étalage de puissance informatique. Il a confiance dans le processus et il est prêt à s’en remettre docilement aux choix de la machine. En fait, l’ordinateur n’est qu’une façade. Dans la pièce voisine, la femme de Sid Bliss (jouée par Hattie Jacques) traite l’information en utilisant ses propres méthodes, très humaines : elle réintroduit dans la machine une fiche correspondant vaguement aux attentes du jeune homme. Les clients ne se doutent de rien, ils sont bluffés. La technologie a fait du chemin depuis l’époque où Sid James faisait rire les Britanniques, mais notre capacité à être impressionnés par des traitements informatiques qui nous dépassent reste intacte. Seul le langage a changé. Désormais, c’est le mot “algorithme” qui nous fait écarquiller les yeux et lâcher des “ooooh” admiratifs. Voilà un moyen garanti de capter l’attention des gens : faire quelques calculs, en attribuer les résultats à un algorithme, regarder les médias et l’opinion les gober.
“Apothic Red Wine crée un algorithme unique en son genre afin de révéler la face cachée de votre personnalité”, pouvait-on lire dans un communiqué de presse typique, diffusé récemment dans des centaines de boîtes mail ; Yahoo, le Daily Mirror, le Daily Mail, notamment, se sont jetés dessus et en ont relayé les conclusions sans le moindre recul. Difficile de dire avec quelle rigueur scientifique l’étude d’Apothic avait été réalisée, mais quelle importance ? Un algorithme était aux commandes et le tour était joué.
Recette. La prochaine fois que nous serons sur le point d’être impressionnés par l’avènement d’un “algorithme extraordinaire”, n’oublions pas que notre vie est gouvernée par eux depuis belle lurette et que nous-mêmes en générons un grand nombre tous les jours. Ainsi désignés d’après le nom de l’éminent mathématicien perse Muhammad Ibn Musa Al-Khwarizmi [latinisé en Algoritmi], les algorithmes sont simplement des séries d’instructions sur la manière de réaliser quelque chose : la recette de gâteau au chocolat de Mamie pourrait tout aussi bien faire l’objet d’un algorithme que n’importe quel programme informatique. Or, si les algorithmes sont destinés à définir très précisément des séquences d’opérations et à résoudre des problèmes, ils n’offrent aucune garantie.
C’est inquiétant, bien entendu, car nous vivons à l’ère de l’information. Les données s’accumulent à un rythme alarmant et, pour ne pas sombrer dans le chaos, nous devons en confier la gestion à des algorithmes. Nous faisons confiance à des applications de navigation par satellite pour collecter des informations, telles que la longueur d’une route, l’heure du jour, la densité du trafic, les limitations de vitesse et les barrages routiers, afin qu’elles nous fournissent une estimation de notre heure d’arrivée ; mais la précision de celle-ci dépend de la qualité de l’algorithme. Nos vies sentimentales sont parfois orientées par des sites de rencontres en ligne qui s’engagent sur un “taux de correspondance” [censé mesurer les affinités entre deux personnes].
Nos achats en ligne, qu’il s’agisse d’un aspirateur ou de téléchargement de musique, s’appuient sur des algorithmes. Si vous lisez cet article en ligne, c’est grâce à un algorithme. A terme, notre environnement sera de plus en plus déterminé, en temps réel, par les mathématiques. Nous devons nous y adapter ; nous savons que ce n’est pas un être humain qui nous suggère un choix de films chez Netflix ou Apple. Peut-être l’algorithme fait-il mieux le boulot.
A l’heure où des données sont générées dans tous les domaines, depuis l’équipe nationale de cricket d’Angleterre jusqu’à votre chauffage central, il faut bien avouer que les algorithmes nous battent haut la main pour ce qui est d’extrapoler une probabilité.
“Cela a été démontré à maintes reprises, et ce pour des raisons évidentes, assure Duncan Ross, spécialiste de la science des données. Car les êtres humains, qu’on le veuille ou non, accumulent les partis pris au fil du temps. Certains sont raisonnables, beaucoup ne le sont pas. Mais en utilisant les données et en en tirant les enseignements, on peut réduire ces partis pris.”
Rapidité. Sur les marchés financiers, où une erreur de jugement peut entraîner des pertes colossales, l’immense majorité des transactions sont désormais sous-traitées à des algorithmes qui peuvent réagir en quelques microsecondes à l’action... d’autres algorithmes. Ils ont leur place sur les marchés depuis que Thomas Peterffy [PDG d’Interactive Brokers Group] a fait un malheur dans les années 1980 en les utilisant pour détecter des stock-options mal évaluées, mais aujourd’hui, dans le monde financier, c’est la science des données qui mène le bal. Des millions de dollars d’actions changent de mains de très nombreuses fois avant qu’un seul courtier ne puisse crier “vendez”.
Nous devons accepter que les algorithmes nous relèguent à une certaine inutilité (sauf lorsqu’ils génèrent des phénomènes comme le “flash crash” [krach éclair] de Wall Street en 2010, au cours duquel le Dow Jones a perdu 1 000 points en une journée, avant de repartir à la hausse).
Mais il n’est pas certain qu’il fasse bon vivre dans un tel monde. Le travail répétitif que réalisent les algorithmes représente un transfert de responsabilités important, et partant une perte de contrôle. Qui dit données dit pouvoir, et quand on songe à tous les aspects de notre vie qui sont déterminés par le traitement de ces données, on peut y voir une dérive déshumanisante. Edward Snowden a révélé l’existence d’un algorithme qui décide si vous êtes ou non citoyen américain : si vous ne l’êtes pas, vous pouvez être surveillé sans mandat. En dehors même des problèmes que cela pose en termes de sécurité et de protection de la vie privée, d’autres éléments échappent à notre contrôle, comme le nivellement de la culture ; depuis de nombreuses années, les secteurs du cinéma et de la musique passent les scénarios et les compositions à la moulinette d’algorithmes pour déterminer si le jeu en vaut la chandelle. Les projets créatifs qui n’entrent pas dans les bonnes cases ont moins de chances de voir le jour. Les algorithmes conçus par des spécialistes de la science des données, en accélérant les traitements et en faisant faire des économies, ont un fort impact sur nous tous, et ce directement.
APPRENDRE À VIVRE AVEC
New Scientist a mis “Les algorithmes qui dirigent nos vies” à la une de son édition du 7 février. Le magazine d’information scientifique y expliquait que ces listes d’instructions sont partout. “Les résultats que vous obtenez par votre recherche sur Internet sont déterminés par des algorithmes, ainsi que les publicités qui s’affichent à côté, les amis dont vous entendez parler sur les réseaux sociaux, les prix de vos billets d’avion et les taux de votre prêt immobilier. Les algorithmes peuvent aussi faire de vous une cible pour les services de renseignement, et même décider si vous avez le droit de voter”, écrit-il. Cela dit, ces systèmes “ne portent pas sur les humains un regard humain”, mais cela ne doit pas nous empêcher d’apprendre à vivre avec, conclut le magazine.
Algorithme : ensemble de règles et d’instructions qui permettent de réaliser une séquence d’opérations pour résoudre un problème. Il peut être traduit en programme exécutable par un ordinateur.
Aussi, rien d’étonnant que les pouvoirs publics s’y intéressent, quoique avec un léger retard. L’année dernière, Vince Cable, secrétaire [britannique] aux Entreprises, a annoncé le financement à hauteur de 42 millions de livres [57 millions d’euros] d’un nouvel organisme, l’Alan Turing Institute [du nom du célèbre mathématicien britannique spécialisé en cryptographie], qui vise à faire du Royaume-Uni le leader mondial de la recherche sur les algorithmes.
Reprendre la main. “Il y a beaucoup de disciplines qui deviennent tributaires de cette science, notamment l’ingénierie, les sciences, le commerce et la médecine”, constate le professeur Philip Nelson, directeur de l’Engineering and Physical Sciences Research Council [Conseil de recherche sur l’ingénierie et les sciences physiques], organisme qui coordonne la production de l’institut. “Il apparaissait comme très important de se doter de moyens sur le plan national pour contribuer à l’analyse et à l’interprétation de ces données. L’idée était de réunir les meilleurs scientifiques pour qu’ils fassent le travail fondamental en maths et en sciences des données pour soutenir toutes ces activités.”
Est-ce une tentative pour reprendre la main sur un secteur qui monte dangereusement en puissance ?
“Pas du tout, estime Nelson. Il s’agit avant tout de rendre les ordinateurs plus bénéfiques pour la société en utilisant mieux les données.”
D’une part, on voit que des algorithmes servent parfois à faire un travail inutile ; d’autre part, on nous invite à craindre l’assujettissement à la machine. Mais on oublie facilement la capacité bienfaisante de l’algorithme.
Duncan Ross est codirecteur et fondateur de DataKind UK, une société caritative qui en aide d’autres à faire un meilleur usage des données dont elles disposent.
De l’organisation d’un “datathon” de week-end jusqu’à des projets sur six mois, des bénévoles aident les organisations caritatives à résoudre une série de problèmes.
“Par exemple, explique Ross, nous avons récemment travaillé avec Citizens Advice [réseau d’associations caritatives indépendantes qui fournissent des informations confidentielles et des conseils aux citoyens sur des questions juridiques, financières ou autres], qui reçoit beaucoup de données de ses différentes antennes. Ils tiennent à repérer rapidement la prochaine grosse affaire. Pendant le scandale des [sociétés de] prêts sur salaire, ils ont le sentiment d’avoir eu un temps de retard, parce que même s’ils donnaient des conseils, ils ont tardé à engager des poursuites. Nous avons donc travaillé avec eux sur des algorithmes qui analysent les rapports détaillés rédigés par des équipes locales afin de repérer les nouveaux problèmes plus rapidement.”
LE SARCASME INDÉTECTABLE
Afin de déterminer les mouvements d’opinion, en particulier lors d’une élection, les instituts de sondage ont de plus en plus recours à des algorithmes capables d’analyser les points de vue exprimés sur Internet, notamment sur les réseaux sociaux. Mais ces programmes sont confrontés à un problème de taille, constate The Washington Post : ils sont incapables de saisir le second degré. “Le problème vient du fait que le sarcasme est en réalité plutôt sophistiqué, explique le quotidien américain. Dire (ou écrire) l’inverse du message que vous voulez diffuser est ce que les linguistes nomment un discours implicite : c’est compliqué à repérer, en particulier sur Internet.” D’après le journal, le problème se poserait aussi de façon pressante pour les agences de renseignement, qui tentent sans succès de développer des programmes capables de détecter le sarcasme en ligne.
Des ensembles de données peuvent être étudiés de manière inattendue afin de produire des résultats puissants. Ainsi, Google a mis au point une méthode d’“agrégation” des données de recherche des utilisateurs afin de repérer les épidémies de grippe.
“Cet algorithme [Google Flu Trends] relevait les données des internautes qui interrogeaient le moteur de recherche sur le traitement de la grippe ou les symptômes de la maladie, commente Ross. A lui seul, cet algorithme s’est révélé aussi efficace que les US Centers for Disease Control [centres épidémiologiques fédéraux]. Si l’on utilise les conclusions de l’algorithme pour améliorer les prises de décisions des médecins, on aura fait un pas de géant.” Mais Google, bien sûr, est une société privée, à but purement lucratif, d’où un nouvel écueil possible : que les big data soient traités par des algorithmes qui ne travaillent pas dans l’intérêt général. Nous n’avons aucun moyen de savoir, nous nous sentons coupés de processus qui nous concernent directement jour après jour.
Pour Ross, il est tout à fait normal de ne pas comprendre grand-chose au travail des scientifiques.
“Qu’est-ce que nous comprenons de ce qui se fait vraiment au Cern [l’organisation européenne pour la recherche nucléaire] ? Pratiquement rien. Parfois, sur des choses comme le boson de Higgs par exemple, vous pouvez faire un article, que vous pouvez presque rendre passionnant en multipliant les anecdotes – mais ce n’est quand même pas du gâteau.”
C’est le moins qu’on puisse dire. Avec “l’Internet des objets”, des milliards de capteurs vont nous entourer, chacun d’eux étant un carrefour de données au potentiel algorithmique. A l’avenir, nous allons devoir vouer une confiance aveugle aux scientifiques des données. De même que le jeune homme en quête de l’âme soeur dans Carry On Loving, nous allons croiser les doigts en espérant que les résultats sortant de la fente soient ceux que nous attendons.
Et nous croiserons aussi les doigts en espérant que les opérations qui se déroulent à l’abri des regards, derrière le mur, ne soient pas effectuées par l’équivalent algorithmique de Sid James et Hattie Jacques.