La vie est mal configurée

Aller au contenu | Aller au menu | Aller à la recherche

dimanche, avril 11 2021

Phrénologie 2.0 et humanités

Sur une liste de diffusion professionnelle, une conversation avait dérivé sur l’importance relative des disciplines dans les programmes de l’enseignement secondaire, et notamment sur le fait que les lycéens « scientifiques » ont en fait un programme équilibré sciences et humanités, tandis que les formations « littéraires » ne comprennent quasiment pas de sciences. Une collègue a alors fait remarquer qu’il ne fallait pas revenir sur la part d’humanités, au risque de voir des diplômés en sciences et techniques se lancer, par exemple, dans la « phrénologie à coup de big data », en rappelant qu’une personne qui n’a pas les capacités de comprendre et analyser ce qu’elle lit est dangereuse.

Cette remarque s’inscrit dans une figure presque obligée des discussions sur l’enseignement, où chacun explique que si la discipline qu’il enseigne, ou une des disciplines dans lesquelles il a approfondi ses connaissances, était plus connue des responsables ou du grand public, de grands malheurs auraient été évités : ainsi, on a pointé l’ignorance des dynamiques exponentielles dans la diffusion du Covid. J’aimerais toutefois analyser certains de ses présupposés, ou du moins ce que je comprends comme étant ses présupposés.

Le raisonnement tenu semble être le suivant :

  1. Des gens proposent des solutions à base de big data, d’apprentissage automatique, etc. qui sont l’équivalent moderne de la phrénologie, une pseudoscience du xixe siècle prétendant que le caractère des humains est lié à la forme de leur crâne.

  2. Si ces gens proposent ce type de solutions, c’est parce qu’ils ne sont pas en mesure de comprendre et d’analyser ce qu’ils lisent ou ce qu’ils font.

  3. Ces capacités sont apportées par les enseignements d’humanités (français, philosophie, histoire et géographie).

Commençons par une anecdote. Il y a quelques années, je siégeais dans un jury devant lequel un étudiant expliquait comment cela s’était passé son stage. Les commerciaux de l’entreprise avaient promis une fonctionnalité avant que celle-ci ne soit conçue ; l’entreprise avait embauché des spécialistes de l’apprentissage automatique et du minage de données, qui avaient produit une solution inefficace et inutilisable ; elle s’était donc défaite de ces personnels, et avait chargé le stagiaire de produire un système fonctionnel. L’étudiant avait donc bricolé une combinaison d’outils qui avait permis de tenir le délai.

Bien entendu, une unique anecdote n’a pas force de généralité, et je ne prétends pas que toutes les entreprises qui font du minage de données et de l’apprentissage automatique sont pareillement (dés)organisées. Il me semble toutefois pertinent de se demander en quoi l’éventuelle formation en humanités du stagiaire aurait pu importer.

Des objectifs avaient été définis par des personnels non techniques, avec une date pour la disponibilité d’une fonctionnalité. En revanche, il n’y avait pas vraiment de critères de qualité définis, pas de protocole expérimental de validation : il suffisait que la fonctionnalité semble convenir. On peut également supposer, vu le comportement de l’entreprise envers ses employés n’ayant pas donné satisfaction, que si le stagiaire avait formulé des objections éthiques ou scientifiques, elle l’aurait renvoyé, ou du moins lui aurait donné une appréciation défavorable. Le stagiaire était d’ailleurs bien conscient qu’il avait fait un peu n’importe quoi dans l’urgence.

Plus généralement, cette anecdote met en évidence que des gens peuvent très bien travailler sur un projet douteux non pas parce qu’ils ne sont pas conscients que le projet est douteux, mais parce qu’on les paye pour faire cela et qu’on ne leur demande pas leur avis scientifique ou éthique. Ceci met en doute le point 2 du raisonnement ci-dessus.

L’anecdote met par ailleurs en évidence le rôle des donneurs d’ordres et de la structure commerciale. On réalise des produits, des services, pour qu’ils soient commercialisés auprès de clients. Qui sont donc les clients des applications « miracles » du big data ?

Parmi les applications les plus controversées on trouve la police prédictive : on prétend trouver dans les données des signes avant-coureurs d’infractions. En France, le ministre de l’intérieur Bernard Cazeneuve faisait la promotion des « algorithmes » pour la détection des terroristes. Un ingénieur technolâtre ? Pas du tout : il est diplômé d’un institut d’études politiques, où (mais peut-être suis-je naïf de le penser) on étudie les sciences politiques et sociales. S’il avait été ingénieur, peut-être aurait-il d’ailleurs été plus sensible aux critiques portant sur le taux de faux positifs, qui exigent peut-être une compréhension minimale du calcul des probabilités.

Plus généralement, celles et ceux qui décident de l’achat de logiciels de justice ou de police prédictive ont il me semble le plus souvent suivi des formations de sciences politiques ou de droit, et rarement des formations scientifiques et techniques. On est donc en droit de se demander si ces formations, pourtant tournées vers les humanités plus que vers les sciences ou la technique, donnent une capacité particulière à faire preuve d’esprit critique devant des propositions technologiques. Le point 3 ci-dessus mériterait donc clarification.

Revenons donc à la « phrénologie 2.0 ». Dans sa thèse, Églantine Schmitt dit :

La naturalisation des objets des sciences de la culture, telles que la criminalité (Xiaolin Wu et Zhang 2016) ou l’orientation sexuelle (Wang et Kosinski 2017) revient à un retour à la phrénologie et à une négation sommaire des résultats des sciences de la culture dans leur ensemble.

Si Wu et Zhang sont effectivement dans un département d’ingénierie informatique d’une université shangaïenne, Wang et Kosinski sont dans une graduate school of business et ont publié leur article au Journal of Personality and Social Psychology, publiée par l’American psychological association. Il ne s’agit donc pas là d’une publication dans une revue d’ingénieurs ou de chercheurs en informatique, que l’on pourrait soupçonner d’inculture en matière de sciences humaines.

Ainsi, le raisonnement de ma collègue me semble pécher sur plusieurs points. Pour moi — et je conçois que l’on puisse ne pas être d’accord avec mon point de vue — le problème n’est pas l’inculture supposée des « techniciens », l’immense attraction que les donneurs d’ordres ressentent pour des solutions magiques qui peuvent réduire les coûts et les délais d’activités habituellement assurées par des humains. Ces donneurs d’ordres, qui ont suivi des formations plutôt sciences politiques, ne semblent pas faire preuve d’un esprit critique supérieur à ceux qui dans le public ont suivi des formations plus techniques ou scientifiques.

Peut-être m’objectera-t-on que les instituts d’études politiques, pourtant surnommés « Sciences Po », ne délivrent pas une formation sérieuse en sciences politiques, humaines et sociales. Je ne suis pas qualifié pour en juger.

dimanche, avril 4 2021

La vie par procuration

Comme chaque jour, quand l’ennui me prend, je regarde par la fenêtre. Le ronronnement du ventilateur de l’ordinateur portable, et le petit courant d’air chaud qu’il amène, ne sont pas désagréables.

Ils sont là, comme souvent. Ce mâle arrogant, qui se fait bien remarquer. Quelle impudence ! On aimerait aller le griffer, pour qu’il remballe sa suffisance. Il faut dire qu’il trouve des femelles qui se laissent prendre à son allure de bellâtre.

Pourtant, à d’autres moments, je me laisse aller à des pensées d’un autre ordre. Finalement, n’est-ce pas eux qui vivent vraiment ? Et moi qui ne vis pas, à ma fenêtre ? Que fais-je ici ? N’est-ce pas leur liberté que j’envie, au fond ? Quel destin manqué-je, jour après jour, à me tourner et retourner dans ma domesticité ?

C’est alors qu’on me tire de mes pensées : « Alors, chat, encore à regarder les pigeons ?».


vendredi, avril 2 2021

Bureaucratie et Covid

La gestion de la crise du Covid a mis en évidence divers mécanismes bureaucratiques qui existent par ailleurs en temps normal, mais dont l’action est peut-être alors moins évidente, et en tout cas cause moins de morts.

Citons deux épisodes. À l’automne dernier, on m’a demandé si je pouvais venir à Paris en novembre pour une étude liée à la qualité de la vie au travail ; distanciel impossible. Bien entendu, la qualité de la vie au travail est un sujet important ; mais était-il bien raisonnable d’imposer à des agents de toute la France de prendre les transports pour venir à Paris à des réunions ou évènements physiques, alors que l’épidémie croissait à nouveau et que l’on parlait de confiner à nouveau le pays en prévision des vacances de Noël ?

Comment a-t-on pu en arriver là ? On peut penser que ce projet a été conçu à un moment où, l’épidémie ayant décru, on pensait à relancer en plein les activités en présentiel, avec certes quelques mesures de sécurité. La rentrée 2020, le mot d’ordre était à la fin du télétravail exceptionnel, les agents devaient absolument revenir dans les services, même pour des activités que l’on pouvait parfaitement exercer en télétravail. La bureaucratie conçoit son projet, peut-être dans une vision trop optimiste de l’avenir, et ensuite ce projet suit son cours, et ceci même alors que les circonstances ont changé.

Plus récemment, l’Éducation nationale a autorisé à nouveau l’éducation physique et sportive en intérieur ; des témoignages divers indiquent que souvent les enfants sont incités à pratiquer l’EPS sans masques. Or, dans le même temps, on interdisait aux agents publics adultes de faire des réunions avec masques à plus de 6 personnes, et une semaine après on a annoncé la fermeture générale des établissements scolaires. Il est manifestement incohérent d’autoriser des activités particulièrement risquées pour ensuite tout fermer. Il semble également curieux d’avoir fait pratiquer de l’EPS en extérieur pendant les mois d’hiver pour ensuite encourager à la pratique en intérieur pour les beaux jours.

Je soupçonne que là encore l’incohérence s’explique par un processus bureaucratique. La presse citait des témoignages d’enseignants d’EPS soulagés de pouvoir à nouveau pratiquer leur métier. On peut supposer que leurs associations professionnelles, peut-être leur inspection générale, avaient fait pression sur le ministre afin de revenir sur les mesures de sécurité. Sans doute il y avait-il des considérations de programme à finir : si le programme prévoit de la gymnastique avec agrès, il faut la pratiquer en gymnase. Comme cela prend du temps, la décision est intervenue alors qu’il était déjà trop tard, que les circonstances avaient changé, l’épidémie flambait à nouveau et on considérait déjà une nouvelle fermeture des écoles.

Constatons l’ironie que dans un cas comme dans l’autre, il s’agit de promouvoir des activités censées favoriser la bonne santé de leur public (qualité de vie au travail, sport), mais qu’on prend des décisions qui risquent d’avoir l’effet contraire. C’est là probablement un trait de la bureaucratie : elle prend, par inertie, par incapacité à évaluer ses procédures par rapport à des objectifs, des décisions contraires aux objectifs qu’elle est censée poursuivre.

Ce qui me frappe, c’est l’apparente incapacité d’anticipation. Alors qu’on voit l’épidémie monter, que l’on peut prévoir qu’elle continuera de monter, les bureaucraties continuent selon leurs planifications basées sur un retour à la quasi normale, selon des programmes dont la pertinence n’est jamais remise en cause. Nous-mêmes dans la recherche ne sommes pas blancs là-dessus : les cas ne manquent pas de collègues persistant à planifier des réunions, des colloques en présentiel alors que la situation s’aggravait.

dimanche, janvier 31 2021

La formalisation mathématique de la loi

On s’est beaucoup inquiété, souvent à juste titre d’ailleurs, de la « gouvernance algorithmique » et de prises de décisions concernant les individus prises par des algorithmes (par exemple, l’attribution ou le refus de prêts, de liberté conditionnelle…) ; je ne reviendrai pas là-dessus et renvoie par exemple à Weapons of math destruction (O’Neill).

Il y a toutefois un sujet où la gouvernance algorithmique est socialement acceptée, et même désirée, depuis longtemps : il nous semble parfaitement naturel et raisonnable que le montant de nos impôts découle de l’application de formules précises à partir des données déclarées. Nous nous attendons à dispcuter éventuellement de la qualification des faits résumés dans ces données, par exemple si telle dépense peut ou non être prise en compte comme frais professionnel, pas à pouvoir discuter de notre taux d’imposition. (*)

C’est dans ce contexte que s’inscrivent les travaux de Denis Mérigoux et de ses collaborateurs, visant à donner des outils pour formaliser les calculs d’impôts, de prestations sociales, etc. En effet, ceux-ci sont actuellement d’une part décrits dans des textes de loi, d’autre part dans des programmes mettant en œuvre les calculs. Ces programmes sont rédigés dans des langages de programmation parfois obsolètes, et en tout cas peu adaptés aux analyses mathématiques car manquant d’une définition mathématique claire et commode d’utilisation.

L’analyse mathématique, mieux encore si elle est automatisée, est pourtant potentiellement précieuse pour la prise de décision politique. On peut ainsi vouloir répondre à des questions telles que « existe-t-il une situation où une hausse de revenus avant impôt conduit à une baisse de revenu après impôt », et ce par une analyse exhaustive des règles d’imposition. Cela est possible en traduisant fidèlement les règles d’imposition dans le format d’entrée d’outils appelés solveurs SMT, et n’est possible que si l’on peut associer un contenu mathématique clair à ces règles.

Je m’adresse ici à mes collègues de droit ou sciences politiques : pensez-vous que ce genre d’outils permettrait d’éclairer le législateur, ou encore les commentateurs ?

Parmi les objections que je vois à de tels procédés, il y a le manque de familiarité avec les mathématiques ; c’est la moquerie classique du Canard enchaîné envers les réglementations comportant des formules mathématiques niveau lycée. Je ne pense pas que cette objection soit sérieuse : le Code général des impôts est assurément bien moins intelligible.

Pour ma part, j’ai non pas une objection, mais une mise en garde. Une modélisation mathématique peut tromper car elle ne tient pas compte de ce qui est en dehors du modèle. C’est une évidence pour quiconque a travaillé dans ces domaines, mais pas forcément pour tout le monde, témoin les réponses du type « l’ordinateur a dit que » sans interrogation sur ce qui a été calculé sur quelles bases. Une analyse exhaustive d’un modèle concluant à l’absence d’un certain effet pervers ne permet pas de conclure quant à des situations hors modèle ou en ce qui concerne des effets pervers voisins mais distincts. À l’inverse, si l’analyse conclut à l’existence d’un effet pervers, il est possible de faire relire le scénario menant à cet effet par des spécialistes pour vérifier si le cas est effectivement possible.


(*) J’ai cru comprendre qu’il y a des possibilités de négociation pour les VIP. Je parle ici des impôts des citoyens et entreprises du commun.

lundi, janvier 25 2021

Les affirmations globalisantes, ou un petit pseudo paradoxe poppérien

Avertissement : ce qui suit n’a pas prétention à constituer un article d’épistémologie, de philosophie ou de tout autre domaine approchant. Je suis bien conscient que des gens ont dû réfléchir à ces questions mieux que moi et ont probablement écrit dessus. Ceci est un blog rédigé à titre extra-professionnel ; mes publications scientifiques sont ailleurs.

L’épistémologie poppérienne classifie les théories scientifiques selon leur degré de réfutabilité : plus une théorie fait de prédictions réfutables, meilleure elle est. Par exemple, une théorie de la gravitation s’appliquant à tous les objets est plus réfutable, donc meilleure, qu’une théorie ne s’appliquant qu’aux corps célestes, car on peut la réfuter par des expériences sur des objets terrestres. À l’inverse, une théorie qui ne donne dans sa structure aucune occasion d’être prise en défaut, parlant par exemple de dieux vivant dans un univers parallèle inaccessible et sans influence sur le nôtre, est de nature métaphysique.

Passons maintenant à un sujet d’actualité : certaines affirmations selon lesquelles les recrutements dans l’enseignement supérieur seraient déterminés par des préférences d’idéologie politique. En apparence, il s’agit d’une assertion plus générale, donc plus réfutable, qu’une assertion selon laquelle les recrutements en sciences politiques seraient déterminés par des préférences d’idéologie politique. En effet, il suffirait pour réfuter cette théorie d’exhiber un recrutement non teinté d’idéologie dans n’importe quelle discipline.

(Note : le sujet de la discussion n’est pas que les recrutements en sciences politiques sont teintés d’idéologie ou ne le sont pas. Je parle de formes de discours, pas de la vérité de ce qui est dit.)

Pourtant, à l’usage, dans les discussions, c’est le phénomène inverse qui se passe. Quand on objecte, face à de telles assertions générales, que l’on n’a jamais entendu parler de recrutements selon les préférences politiques en informatique ou en chimie, on s’entend dire que « certes bien sûr en sciences exactes, mais ne soyez pas naïf, vous voyez très bien ce que je veux dire ». Il est impossible de vraiment disputer ou réfuter ces affirmations générales.

À l’inverse, une affirmation de portée réduite, en apparence moins réfutable, l’est paradoxalement plus. Par exemple, l’affirmation « le recrutement de M. Dupont en 2018 au poste de professeur des universités à l’Université de Rummidge était motivé par son appartenance à la mouvance bleutiste, à laquelle appartenaient plusieurs membres du comité de sélection » est considérablement plus susceptible de débat contradictoire.

L’apparent paradoxe me semble venir du faible contenu informatif des généralités énoncées. Si celles-ci étaient formulées sous la forme de statistiques, encore serait-il possible de les réfuter par des études statistiques. Elles me semblent relever pour part de la technique rhétorique « de la motte castrale » : on commence par un énoncé en apparence très puissant et général, et on se rabat, alors que celui-ci est mis en difficulté, par des affirmations plus réduites (« mais non bien sûr pas en sciences exactes »), assorties d’étonnement envers la naïveté de l’interlocuteur, qui a compris une assertion universelle comme l’étant vraiment.

Mon approche de ce genre d’affirmations est de demander à l’interlocuteur de préciser sa pensée. Ceci est hélas vite interprété comme de la mauvaise volonté ou du « trolling ». Cette précision me semble pourtant importante, car on finit alors généralement par tomber sur une affirmation factuelle et réfutable. Ainsi, un interlocuteur m’affirmait qu’il y avait au CNRS un nombre considérable de chercheurs en sociologie (il méprisait cette discipline) ; or ce nombre était d’un ou deux ordres de grandeur au-dessus de celui indiqué dans le bilan social de l’établissement.

J’ai déjà lu l’affirmation qu’une pensée confrontable au concret, aux statistiques, aux faits, par opposition aux généralités globalisantes, est plate. Je préfère parfois la platitude.

samedi, juin 20 2020

Des algorithmes de détection des propos illégaux

Je vais tenter de synthétiser ici une discussion sur Twitter, d’autant plus que mon propos d’origine était un peu trop schématique.

Parmi les observations du Gouvernement au Conseil constitutionnel au sujet de la « loi Avia » on trouve

« D’autre part, il est établi que les grandes plateformes disposent déjà de solutions technologiques, notamment d’algorithmes, leur permettant de détecter des contenus illégaux »

Cette phrase mérite commentaire, notamment parce qu’elle me semble avoir un sens faible peu contestable et un sens fort très contestable : s’agit-il de dire que des algorithmes permettent de signaler à des humains des propos possiblement illégaux, à charge pour ces humains de vérifier ce qu’il en est, ou que des algorithmes pointeront à coup sûr des contenus illégaux ? On peut également s’interroger sur l’article indéfini « des » : s’agit-il de prétendre détecter une très large classe de contenus illégaux, ou seulement certains ?

Avant toute chose, je dois préciser que si je m’y connais raisonnablement en matières d’algorithmes, je ne suis pas spécialiste de traitement automatique de la langue naturelle ou d’apprentissage automatique. Je serai donc enchanté que des personnes plus savantes nuancent mes propos.

Le champ lexical

S’il s’agit de dire que des algorithmes permettent de pointer certains contenus suspects, alors il s’agit d’une banalité. On peut ainsi très facilement rechercher dans les textes publiés une liste de mots utilisés comme insultes homophobes ou racistes, des mots très connotés en ce sens.

Toutefois, une telle méthode ne satisfera pas au sens fort de l’affirmation gouvernementale. En effet, la simple présence d’un mot connoté comme insultant ou discriminatoire ne suffit pas à fonder l’illégalité d’un texte. Quelques exemples :

  • Le mot « pédé » est utilisé comme insulte à l’encontre des hommes homosexuels. Toutefois ceux-ci l’utilisent entre eux comme une forme de signe de connivence. De même, en anglais américain, le terme « nigger » (« négro ») n’aura pas la même connotation suivant qu’il est employé par un blanc ou un noir.

  • Les historiens, les enseignants, les militants, sont parfois amenés à rapporter les propos de personnes racistes, antisémites ou homophobes, sans pour autant adhérer à ceux-ci.

Bien sûr, on pourrait raffiner les méthodes. Le traitement automatique de la langue naturelle ne se limite heureusement pas à détecter la présence de mots-clefs. Il existe par exemple des techniques, toujours basées sur le champ lexical, qui tentent de repérer des caractéristiques plus fines découlant d’associations de mots ; par exemple on pourra associer un concept « train de voyageurs » à un texte parlant de voitures et de locomotive, et un concept « automobile » à un texte parlant de voiture, d’essence et de volant. Peut-être pourrait-on arriver à distinguer lexicalement d’authentiques insultes racistes (texte généralement vulgaire) de leur citation dans un cadre historique (contexte avec vocabulaire professoral) ?



Parler de ce que pensent les racistes

Pourrait-on distinguer ce qui relève de la citation de ce qui relève du propos personnel ? Pas sûr (notamment au risque que les racistes se mettent à tout présenter comme des citations). Que l’on juge également de ce propos :

« Si le bicot n’existait pas, on inventerait quelqu’un d’autre. »

Le personnage qui parle, du roman Élise ou la vraie vie de Claire Etcherelli, explique que les racistes ont besoin d’une catégorie de personnes à détester en employant le vocabulaire que les racistes utilisent. Étant lui-même dans la catégorie visée par ce vocabulaire, il peut se permettre de l’employer, à titre ironique. Il n’y a pas ambiguïté de cela dans le contexte du roman, à la teneur antiraciste. Je me demande cependant comment des algorithmes fondés sur les champs lexicaux réagiraient ; et même, je me demande comment des personnels chargés de la censure des contenus « manifestement illégaux », soumis à de fortes cadences, réagiraient à la lecture de cette phrase.

Plus profondément, la détection automatique de contenus illégaux par le champ lexical se heurte au fait que le système ne comprend pas ce à quoi les mots réfèrent. Ces systèmes associent des catégories à des mots ou des associations de mots, qu’il faut d’ailleurs faire étiqueter par des humains — même si un algorithme construit tout seule une catégorie lexicale correspondant à des insultes racistes envers les maghrébins, il faudra obtenir l’information que cette catégorie est effectivement répréhensible, par exemple en constatant qu’elle est souvent présente dans des propos qui ont été manuellement retirés pour cause de racisme.

Le contexte

Des propos peuvent être racistes sans employer des mots connotés comme racistes, voire employer un langage très châtié. Là encore, l’information lexicale peut donner des indications, notamment par certaines associations. Il n’y a rien d’en soi antisémite à parler de « juifs », ni de parler de médias, ni de parler de banques, mais un texte qui semble à la fois parler de juifs, de médias et de banques peut porter sur le cliché antisémite que les juifs contrôleraient les médias et les banques. N’étant pas juriste, je ne sais pas à quel point un texte racontant cela serait illégal en France, mais en tout cas il me semble que la détermination de son caractère illégal demanderait un examen assez fin.

Le caractère légal ou illégal de propos peut dépendre non seulement du texte en tant que tel, mais également de la réalité. Le qualificatif de « pédophile » est insultant ; les actes pédophiles étant punis par la loi, il suggère que la personne ainsi qualifiée a commis des délits ; enfin, il expose la personne visée à la vindicte publique voire à des agressions. L’usage de ce terme est donc (là encore je ne suis pas juriste) diffamatoire, et on pourrait attendre la plus grande promptitude des plates-formes d’hébergement à retirer des propos utilisant ce qualificatif à l’encontre de personnes vivantes en raison des risques qu’il leur fait courir.

Toutefois… l’usage de ce qualificatif peut être parfaitement légitime, par exemple dans la phrase « Gabriel Matzneff est pédophile. ». Il n’y a pas en effet diffamation si les faits reprochés sont vrais (encore que cette exception de vérité souffre, si j’ai bien compris, elle-même d’exceptions au cas où les faits sont anciens ou relevant de la vie privée). Pour déterminer si un propos est légal ou illégal, l’algorithme devrait avoir une compréhension du monde suffisamment fine pour savoir si le texte dit la vérité ou non, ce qui semble supposer une véritable intelligence artificielle, dont les possibilités dépasseraient largement la détection de contenus illégaux.

Bien sûr, là encore on pourrait imaginer des mécanismes plus fins : si une personne est qualifiée de pédophile, mais que ce qualificatif lui est attribué dans de nombreux articles de presse, alors ce n’est probablement pas un qualificatif illégal. On mesure toutefois la difficulté à utiliser ce type d’analyses, ne serait-ce que parce qu’une personne peut être accusée et voir son nom traîné dans la boue dans les médias, puis innocentée et qu’alors les nouveaux propos lui attribuant l’accusation peuvent relever de la diffamation.

Plus généralement, on peut raffiner et complexifier à l’infini les mécanismes censés pointer le caractère légal ou illégal d’une expression. Sur un réseau social, par exemple, on pourra analyser le graphe des « amis », ou encore de qui parle à qui. On pourrait par exemple ainsi différencier des militants racistes d’historiens, ou encore des homophobes employant le mot « pédé » comme insulte d’homosexuels l’employant comme signe de connivence et de revendication. Je relève toutefois qu’obtenir pareil résultat impliquerait, au passage, d’établir plus ou moins automatiquement des fichiers de personnes selon leur orientation sexuelle, leur « ethnicité », ou leur orientation politique, ce afin de déterminer si les propos qu’elles profèrent relève d’un usage légitime ou non ; cela me semble aller à l’encontre d’autres dispositions législatives !

Le solutionnisme

Comme dans d’autres domaines de l’informatique, le caractère heuristique du traitement automatique de la langue naturelle et de l’intelligence artificielle rend difficile la critique de ses limites : à chaque limitation pointée, on peut objecter qu’avec tel ou tel raffinement, telle ou telle extension on peut faire mieux. La question, au fond, n’est pas là.

Les solutions technologiques, les « algorithmes », ne devraient être là que pour « dégrossir » le travail. Bien entendu, il n’est pas inutile, si l’on veut diminuer la charge de travail des personnels chargés de lutter contre les propos illégaux, d’avoir des dispositifs automatiques qui signalent des propos suspects. Toutefois, ces dispositifs ne sauraient se substituer totalement à un jugement humain informé. Le risque est grand que sinon des propos ne soient censurés parce que « l’ordinateur l’a dit », sans voies de recours ; ou encore que des propos potentiellement illégaux soient négligés car ne rentrant pas dans le cadre détecté par l’algorithme.

Rappelons que, même pour des humains, il est difficile de déterminer le caractère illégal d’un propos, à telle enseigne qu’à Paris il y a une chambre spécialisée du tribunal de grande instance (la 17e) spécialisée dans les délits de presse. C’est d’ailleurs pour cela que certains textes de loi n’imposent d’action que par rapport à des contenus « manifestement » illégaux.

Le succès apparent des « algorithmes » dans les moteurs de recherche ou les systèmes de suggestion de contenus ou de publicités ne doivent pas nous leurrer sur leurs capacités. Nous savons tous comment parfois ces moteurs nous font des suggestions hors sujet, et nous en sourions ; nous souririons moins si un dispositif automatique nous censurait pour de mauvaises raisons. Les enjeux d’une mauvaise décision de censure ne sont pas les mêmes. Les difficultés sont également différentes : on est clairement ici dans un cadre « adversariel », avec des gens qui vont tenter de dissimuler à l’algorithme le caractère illégal de leurs propos, voire tenter de mettre en cause comme illégaux des propos de personnes à qui ils veulent nuire.

Plus généralement, nous devons nous interroger collectivement sur le « solutionnisme technologique », soit la tendance, lorsqu’il y a un problème social, à vouloir le résoudre par des moyens technologiques souvent peu maîtrisés. Je pense d’ailleurs que ce solutionnisme est plus couramment le fait de responsables politiques et d’entrepreneurs qui veulent leur vendre des solutions que des scientifiques qui travaillent dans les domaines concernés.


dimanche, juin 16 2019

Baudruches

Un classique de la réflexion politique dans certains milieux qui se considèrent avancés est de prétendre révéler des agissements mystérieux, connivences, et relations cachées diverses. Permettez quelques anecdotes personnelles.

Il y a une douzaine d’années, j’intervenais beaucoup sur Wikipédia. À ce titre, j’avais quelque peu neutralisé un compte-rendu assez… orienté de certains événements à l’École normale supérieure. Un ancien élève de cet établissement (enseignant d’histoire en lycée, je crois) avait doctement expliqué que je devais certainement ma place de chercheur dans un laboratoire hébergé dans cet établissement à la protection de sa directrice, à qui j’étais donc redevable. Cela était bien entendu ridicule (les nominations de chercheurs du CNRS ne se passent pas comme cela), mais c’était sans doute crédible dans l’esprit de gens éloignés du monde de la recherche.

À la même époque, j’avais enlevé de la biographie d’Alain Finkielkraut le qualificatif de « journaliste d’extrême droite ». Je ne sais pas comment qualifier l’activité médiatique d’Alain Finkielkraut, mais il ne s’agit certainement pas de journalisme… quant à la qualification d’extrême-droite, il n’y avait pas de sources pour cela. Certains, relevant qu’Alain Finkielkraut et moi étions tous deux enseignants à l’École polytechnique, en ont conclu que je le connaissais et que c’est pour cela que je le protégeais. (Bien entendu, il y a une certaine naïveté à penser que parce que deux personnes sont enseignantes dans deux départements différents du même établissement, elles se connaissent forcément… je n’ai vu Alain Finkielkraut en personne qu’une fois.)

Plus récemment, des gens protestaient contre la tenue d’un colloque sur Frontex au rez-de-chaussée du bâtiment où est situé mon laboratoire. Des tracts distribués prétendaient établir un lien entre ce colloque et les occupants des étages du bâtiment, censés y établir des contacts juteux. Le bâtiment lui-même y étant qualifié d’ultra-sécurisé. Bref, le complexe militaro-industriel se disposait à vendre de la haute technologie pour tirer sur les réfugiés africains, ou quelque chose comme cela ! La vérité était que les salles du rez-de-chaussée sont utilisables par n’importe quel laboratoire universitaire, ici des juristes, sans que les laboratoires situés dans les étages ne soient consultés ou invités au colloque; par ailleurs, rien de ce qui est fait dans mon laboratoire n’intéresse directement une agence de garde-frontières. Quant au bâtiment «ultra-sécurisé», il ne l'est pas plus que n'importe quel immeuble de bureau dont on veut éviter qu'il soit cambriolé.

Je me demande combien de mystérieuses connivences révélées ici ou là ne sont que pareilles baudruches.

mercredi, juillet 25 2018

L'incroyable étant réel, où finit le plausible ?

J’ai expliqué être opposé aux machines de vote électronique car j’estime qu’en cas de contestation, il serait impossible à l’expertise technique de convaincre les électeurs de l’absence de tricherie. On m’a demandé s’il ne s’agissait par là d’une forme de renoncement.

Le scientifique doit-il renoncer à son expertise au motif que des complotistes pourraient l’accuser de malhonnêteté ? La raison doit-elle s’incliner devant la croyance et la partialité politique ? Sans doute non. Toutefois, rejeter toute méfiance comme relevant du complotisme irrationnel, et donc à ignorer, est à mon avis une mauvaise analyse.

Si l’on m’avait dit, il y a quelques mois qu’un proche du Président de la République se faisait passer pour un policier pour pouvoir rouer de coups des manifestants, peut-être par sadisme, j’aurais dit qu’il s’agissait d’un excellent scénario pour un film censé se passer dans une dictature sud-américaine des années 1970, mais que c’était « trop gros » pour se passer en France. Et pourtant, des choses « trop grosses » se sont passées, avec des complicités multiples.

L’incroyable d’hier est devenu le réel d’aujourd’hui. Si pareilles choses sont possibles, il est rationnel de penser que d’autres, moins visibles, le sont, et il est donc rationnel d’être méfiant !

mercredi, mai 30 2018

APB, ParcourSup et les méchants algorithmes

Voici ce que je comprends d'APB et ParcourSup, expliqué en termes compréhensibles du grand public. Merci de me corriger en cas d'erreur.

« Dans le temps », quand on passait les concours de certaines grandes écoles, celles-ci établissaient une « liste principale » d'admis et une « liste complémentaire ». Les admis sur la liste principale étaient appelés, et s'ils démissionnaient (habituellement, parce qu'ils étaient admis dans une autre école qu'ils préféraient), on appelait des candidats sur la liste complémentaire, qui eux-mêmes pouvaient démissionner. Bref, si l'on était sur la liste principale on savait que l'on était admis, mais on en était aussi quasi sûr si on n'était pas trop loin sur la liste complémentaire, au vu de ce qui s'était passé les années précédentes.

Le procédé était toutefois laborieux : tout n'était pas centralisé (il me semble qu'il y avait un service Minitel, mais pour certains concours seulement) et il y avait, au moins pour certaines écoles, des courriers papier qui s'échangeaient (on recevait une convocation pour admission et il fallait répondre par courrier pour démissionner). Tout ceci faisait que certains candidats étaient finalement admis en septembre, à quelques jours de la rentrée, en général dans un établissement éloigné du logement parental. Heureusement que ces établissements sont dotés de résidences !

Une première amélioration consiste à tout centraliser sur un unique service télématique, au lieu d'utiliser des courriers et des services séparés. Par ailleurs, pour assurer une réponse raisonnablement rapide, il faut empêcher qu'un étudiant hésitant puisse bloquer les autres, donc on va exiger qu'entre plusieurs offres fermes d'admission il ne puisse en choisir qu'une (sa préférée parmi celles proposées), et ainsi libère les autres. C'est le fonctionnement de ParcourSup.

Notons qu'avec ce système, il n'y a pas obligation de se désister de formations sur lesquels on est encore en attente, même si l'on sait que l'on est admis sur une formation qu'on leur préfère ; on me dit que certains lycéens tergiversent ainsi, ce qui prolonge les incertitudes des autres.

On peut alors se demander pourquoi demander au candidat à chaque fois de choisir sa préférée parmi les offres fermes déjà proposées, alors qu'il suffirait de lui demander une fois pour toutes son ordre de préférence : le programme peut alors répondre de lui-même à la question de l'offre préférée parmi celles présentées, et on peut affecter rapidement les étudiants dans les formations sans avoir à leur poser des questions à plusieurs reprises. C'est le fonctionnement de l'algorithme à la base d'APB (algorithme de Gale & Shapley version « optimale pour les universités »).

Si tout est si simple et compréhensible, pourquoi toutes ces controverses sur l'opacité des algorithmes, les tirages au sort etc. ? Tout d'abord, sur APB.

APB concernait des formations sélectives et non sélectives. Les formations sélectives classent leurs candidats et peuvent en refuser certains, les formations non sélectives (la plus grande partie des licences universitaires) ne le peuvent pas, et doivent donc a priori accepter tout candidat avec le baccalauréat — quel que soit la série de celui-ci et l'adéquation avec les études envisagées. Cependant, une formation non sélective peut avoir une limite de capacité, ne serait-ce qu'en raison de contraintes de locaux, d'équipements et de personnels enseignants. Dans ce cas, APB départageait les candidats par tirage au sort.

Il n'y a évidemment aucune fatalité à devoir utiliser un tirage au sort si l'on utilise un algorithme d'affectation. En revanche, si, suite à des décisions politiques (refus d'accorder plus de moyens, refus de classer ou sélectionner les candidats) on se retrouve avec plus de candidats que de places, il faut bien un moyen pour les départager, qu'on utilise un procédé automatisé ou non.

On dit que l'algorithme d'APB donnait un bonus au premier choix des candidats. On dit également qu'au moins certaines années, les formations étaient informées du classement que le candidat leur attribuait. Ceci fausse les bonnes propriétés de l'algorithme de Gale & Shapley. On peut éviter tout doute à ce sujet en demandant aux candidats leurs préférences quant aux formations sur lesquelles ils candidatent après que celles-ci aient rendu leurs classements.

Par ailleurs, ni APB et ParcourSup ne sont strictement basés sur un classement (fût-il obtenu par tirage au sort). Ils prennent en compte des critères de résidence, de taux de boursiers, et de places en internat. Tout ceci complexifie considérablement le problème à résoudre et éloigne le fonctionnement de l'algorithme des principes simples évoqués plus haut.

Enfin, dans le cas de ParcourSup, ainsi que dans le cas des formations sélectives pour APB, il y a la question du classement des candidats par les formations. Dans les concours classiques des grandes écoles, ce classement est obtenu par des écrits anonymisés et des oraux menés par un jury restreint, avec des harmonisations et des coefficients connus et publiés d'avance. Dans le cas de ParcourSup, on se base sur des notes de lycée non harmonisées, des appréciations d'enseignants, des lettres de motivation, selon des processus tenus secrets que l'on a parfois qualifiés d'« algorithmes locaux » — c'est un bien grand mot pour désigner ce qui, dans certains cas en tout cas, est un classement selon la moyenne avec coefficients de certaines notes de lycée.

samedi, mai 26 2018

Un humain tellement inhumain

La ministre de l’enseignement supérieur et de la recherche, Mme Frédérique Vidal, a expliqué qu’un des buts de ParcourSup par rapport à APB est de « remettre de l’humain » ; à l’opposé certains jugent « inhumain » le nouveau processus. Humain, inhumain, voilà qui mérite une petite analyse de vocabulaire.

Clairement, Mme Vidal considère qu’un processus plus humain est intrinsèquement meilleur, comme, dans d’autres contextes (alimentation, pharmacie), on considère souvent de nos jours que ce qui est « naturel » est intrinsèquement meilleur. L’« humain », le « naturel », sont considérés comme bons, par opposition à l’automatique, à l’artificiel, considérés comme mauvais.

Pourtant, quoi de plus humain, pour un·e enseignant·e, que de « saquer » une élève jugée « trop sûre d’elle pour son propre bien » car elle a d’excellentes notes dans d’autres disciplines, ou encore un étudiant dont les options politiques ou syndicales déplaisent ? Quoi de plus humain que de noter favorablement, même inconsciemment, un élève que l’on juge agréable ? Quoi de plus humain, pour des étudiants s’estimant mal notés, que de soupçonner l’existence de favoritisme ou de discrimination ?

Pour toutes ces raisons, on a très largement adopté dans l’enseignement supérieur, les examens et les concours, la correction sur copies anonymes. Pourtant, n’est-il pas déshumanisant de remplacer le nom de l’étudiant par un numéro d’ordre ?

Ainsi, ce qui est plus humain, au sens d’une plus grande intervention des sentiments et jugements humains, n’est pas forcément plus juste ou meilleur… ni même d’ailleurs plus humain au sens de respectueux de la dignité humaine.

Quant à ParcourSup, on soutient parfois qu’il s’agit d’un processus plus humain que l’algorithme APB parce qu’il pose des questions successives aux candidats au lieu de les affecter à la suite d’un calcul à partir de l’ordre de leurs préférences. Là encore, on semble considérer qu’il est meilleur d’impliquer l’humain à chaque étape plutôt que de lui demander de se fier au résultat ultime d’un calcul qu’il n’effectue pas lui-même. Attitude curieuse ! Comme si une moyenne de notes calculée à la main était plus humaine qu’une moyenne calculée à l’aide d’un tableur. De fait, l’allongement de la durée du processus due à l’attente des réponses des candidats, bref de leur facteur humain, conduit à une attente et une angoisse que certains jugent inhumaine.

Ainsi, cet argument de l’humanité du nouveau processus confond plusieurs sens de « humain » : « Qui appartient à l'homme, qui lui est propre » (on demande une intervention du candidat à chaque étape », « Qui épouse pleinement la nature humaine dans ses qualités et ses défauts » (y compris la subjectivité de son jugement), et « Qui est sensible à la pitié, qui fait preuve d'indulgence, de compréhension envers les autres hommes ». C’est ainsi qu’avec un processus humain selon les deux premiers sens celui-ci peut s’avérer inhumain au sens du troisième.

mercredi, juin 21 2017

Le chercheur et la vie réelle

Les réseaux sociaux ont beaucoup bruissé hier de cette attaque du député Jean-Luc Mélenchon envers le député et ex-collègue Cédric Villani :

Il y en a quand même, ils [ne] sont au courant de rien, donc quand on va leur expliquer… Non mais il y a des braves gens là-dedans ! Il y a des braves gens ! Bon il y a beaucoup de DRH, des gens comme ça qui ont une conscience sociale assez faible (pas toujours, hein !), mais il y a beaucoup de…[fait des moulinets avec sa main au dessus de sa tête] des chercheurs, des intellectuels, des chais pas quoi… J’ai vu le matheux là, je vais lui expliquer ce qu’est un contrat de travail, il va tomber par terre ! Parce qu’il [ne] le sait pas, tout simplement, il [ne] sait pas ce qu’il y a dedans ! Il ne sait pas que la journée de huit heures, c’est cent ans de luttes ! Le gars il croit que ça a toujours été comme cela !

Cédric Villani a répondu ainsi :

Cher @JLMelenchon, Directeur de l'IHP, j'en ai vu des contrats de travail... mais c'est tjs un plaisir de recevoir des cours particuliers !

Beaucoup de choses ont été dites suite à cette passe d’armes, mais je voudrais donner quelques points factuels.

L’image d’Épinal du chercheur est un être quelque peu fantasque et déconnecté du réel, à l’apparence excentrique, distrait et pas fait pour gérer des réalités terrestres, comme Tryphon Tournesol. Cédric Villani a d’ailleurs abondamment joué de son apparence pour construire sa présence dans les médias — bien entendu, la plupart des chercheurs, fussent-ils en mathématiques, ont une allure bien plus passe-partout. Au-delà de ces aspects superficiels, qu’en est-il réellement ?

En 2017, un chercheur qui veut disposer de moyens doit répondre à des appels à projets de recherche, pour lesquels on lui demande la présentation d’un budget, qui peut faire apparaître des coûts salariaux. Je passe à mes lecteurs la liste détaillée des amusants aspects extra scientifiques à prendre en compte — amortissement du matériel, cotisation ou absence de cotisation chômage, calculs de gratifications de stage, TVA, partage de propriété intellectuelle, règlement financier de l’appel à projet, etc. Très souvent, le chercheur n’est guère aidé pour cela par les services administratifs et doit donc apprendre « sur le tas ».

Quant à un directeur d’unité tel que Cédric Villani, si normalement ce n’est pas lui qui signe in fine le contrat de travail au nom de l’établissement, c’est parfois lui qui organise les recrutements de contractuels (cela peut aussi être un chef de service ou de projet qui le fait), et bien sûr il voit normalement passer pour approbation tous les contrats de travail des contractuels rattachés à sa structure. Là encore, je passe à mes lecteurs la complexité de la gestion administrative et financière d’une unité avec plusieurs tutelles, chacune ayant ses propres marchés publics, ses propres particularités d’emploi.

Bien entendu, cela ne fait nullement du chercheur, fût-il directeur d’unité, un fin connaisseur des aspects financiers et administratifs ou du droit du travail des fonctionnaires et des contractuels de la fonction publique. En même temps, il est bien forcé de s’y intéresser un tant soit peu, sauf à aller au devant de graves problèmes...

(Sinon, il me semble bien que les luttes sociales étaient au programme d’histoire du baccalauréat C du temps où Cédric Villani l’a passé ; cela sans présager de son attention sur cette partie du programme.)

jeudi, juin 15 2017

Les limites de ma vulgarisation

Le ''Journal du CNRS'' m'a sollicité ce printemps pour deux articles qu'ils ont mis en ligne :

  1. Un point de vue sur la question de l'usage des « algorithmes » par les pouvoirs publics et les questions qu'il faut se poser en matière de transparence, d'opposabilité et de contrôle démocratique.
  2. Un article plus relié à mon domaine de recherche sur les méthodes pour assurer la fiabilité des logiciels de contrôle-commande en avionique, sujet qui m'a beaucoup occupé de 2002 à 2007.

J'ai par ailleurs publié avec Virginie Gautron un article aux Archives de politique criminelle un article sur l'usage des « algorithmes » pour rechercher des profils suspects dans la population.

Si je suis effectivement expert en méthodes formelles et j'ai effectivement réalisé avec d'autres des outils industriels dans ce domaine, je ne suis expert ni en méthodes d'apprentissage ni en leur application aux problèmes sociaux ou juridiques ; se pose donc la question de ma légitimité à écrire sur ces sujets.

Je m'en suis évidemment tenu à des généralités que n'importe quel scientifique du domaine qui se tient un peu au courant pourrait énoncer, par exemple au rappel de faits statistiques de base; j'ai par ailleurs fait relire une partie de mes propos par des spécialistes. Pourtant, je ne me sens guère à l'aise, et j'ai d'ailleurs tenté de rediriger mes interlocuteurs vers des collègues plus à même de répondre à leur demande.

J'éprouve, je ne le cache pas, un certain agacement quand je vois des universitaires, faisant état de leurs titres et en tirant légitimité pour s'exprimer en public, parler de sujets qu'ils ne connaissent guère pour dire au mieux des platitudes, au pire des faussetés. Le danger est donc pour moi de me comporter d'une façon que je réprouve chez les autres.

D'un autre côté, il semble que les instances de médiation scientifique, les collègues d'autres disciplines voire les pouvoirs publics manquent d'interlocuteurs scientifiques en informatique. Si personne n'accepte ce rôle, fût-ce pour parler de domaines qu'ils ne connaissent que de loin, ils trouveront d'autres interlocuteurs, encore moins qualifiés. Par ailleurs, le niveau d'explications à fournir n'est souvent guère élevé et ne nécessite pas de connaissances approfondies ; après tout, on attend d'un enseignant-chercheur en informatique qu'il puisse assurer des enseignements de licence même s'ils ne portent pas sur sa spécialité !

Qu'en pensez-vous ?

mardi, mars 7 2017

Laissons la sécurité informatique à ceux qui s'y connaissent

Ce matin, France Info expliquait que le Gouvernement supprimait le vote électronique des Français de l'étranger « tout ça pour » des risques d'attaques. Mon sang n'a fait qu'un tour.

La sécurité informatique, c'est compliqué. En position de défenseur, on doit veiller à tous les points d'attaque — il ne sert à rien d'avoir tout sécurisé si on a laissé un maillon faible. Une fois que l'on connaît un peu le sujet — j'ai la fatuité de croire que c'est mon cas — on se rend surtout compte qu'on ne sait pas grand chose et que la tâche est immense.

Autant dire que sur ce genre de sujets, je fais considérablement plus confiance à Guillaume Poupard, directeur de l'Agence nationale pour la sécurité des systèmes d'information (ANSSI) — par ailleurs ingénieur de l'Armement et docteur en cryptographie — qu'à des politiciens ou journalistes. Si l'ANSSI, qui a effectivement expertisé les systèmes informatiques concernés, rend un avis négatif, c'est sans doute qu'elle a de bonne raisons, comme il l'explique.

Je trouve assez déplorable que des journalistes, en adoptant une terminologie non neutre (« tout ça pour »), minimisent des menaces dans un domaine où ils n'ont aucune compétence, reprenant les arguments de certains politiciens.

Ce paragraphe du Monde me semble donner un bon résumé des réserves quant au vote électronique :

A titre personnel, M. Poupard s’est toujours montré très prudent sur le vote électronique et dit préférer le bulletin papier, meilleure garantie contre le piratage. Les critiques contre les systèmes de vote par Internet ne sont pas nouvelles et ont été largement étudiées – la commission des lois du Sénat rappelait ainsi, dans un document de synthèse publié en 2014, que la pratique est intrinsèquement risquée (pdf), tant sur le plan de l’identification de l’électeur que sur les recomptages a posteriori. Son usage pour les Français de l’étranger avait cependant le caractère d’une « nécessité pratique », permettant « d’assurer un égal accès des électeurs au vote », notaient les sénateurs.

Les arguments de certains politiciens peuvent faire sourire : « Cela s’est passé sans risque et sans problème en 2012 » dit Pouria Amirshahi. Faire d'un unique cas une règle, ce n'est guère sérieux, surtout qu'il est très possible qu'entre temps la menace ait changé (on parle d'ingérences étrangères dans les élections américaines). Faut-il rappeler qu'Amazon S3 a parfaitement fonctionné des années jusqu'à une panne massive, entraînant celle de très nombreux sites Internet ?

Je n'ose penser au désordre, accusations, expertises, contre-expertises, en cas de panne ou suspicions de piratage du vote électronique. Veut-on d'un pareil risque à notre époque de suspicion généralisée et de fausses nouvelles ?

lundi, février 27 2017

Le droit n'est pas logique

La lecture de discussions de réseaux sociaux me donne l'occasion d'illustrer la différence entre logique mathématique et langue naturelle. Ce qui suit paraîtra sans doute évident à bon nombre de lecteurs, mais visiblement ce n'est pas évident pour tout le monde !

On me pointe cette tribune d'une professeure de droit, et notamment cet extrait :

« La loi Taubira s’est donc écartée de cette vérité naturelle pour donner du mariage une nouvelle définition, coupée de la réalité anatomique et biologique, et de surcroît logiquement absurde puisqu’elle aboutit à définir une notion par une proposition contradictoire. Le mariage serait désormais l’union de deux personnes de sexe opposé « ou » de même sexe, c’est-à-dire qu’il désignerait à la fois une chose et son contraire absolu. »

Ainsi, d'après cette professeure, il serait logiquement absurde, c'est-à-dire logiquement contradictoire, d'expliquer que le mariage est l'union de deux personnes de même sexe ou de sexe opposé, car « de même sexe » et « de sexe opposé » sont deux propriétés opposées. Je ne comprends guère cette affirmation.

Si l'on admet que le sexe est une propriété (en mathématiques, une fonction) de l'individu, alors deux personnes sont soit de même sexe, soit de sexe différent. Il s'agit de l'application d'un principe logique général, dit du tiers-exclu, qui dit que quelle que soit la propriété étudiée (ici, que les sexes de deux individus soient égaux), alors elle est vraie ou fausse.

(Ce principe du tiers-exclu n'est pas valide dans les logiques dites intuitionnistes, mais celles-ci n'intéressent que les spécialistes. Quand on parle de logique mathématique sans plus de précision, o0n se place dans une logique classique, c'est-à-dire avec tiers-exclu.)

Ainsi, on n'a pas affaire à une contradiction (une propriété toujours fausse), mais à son opposé, une tautologie (une propriété toujours vraie). (En logique mathématique, le terme « tautologie » n'a pas la nuance péjorative qu'il peut avoir dans d'autres contextes. En particulier, une tautologie n'est pas forcément évidente.)

Bref, l'énoncé cité n'est pas plus folichon qu'indiquer que toute carte d'identité française comporte une date de naissance soit égale au premier janvier 1970, soit différente — énoncé équivalent à indiquer que toute carte d'identité comporte la mention d'une date de naissance. On pourrait, en termes strictement logiques, le retirer de la loi. Alors, pourquoi l'indiquer explicitement ?

C'est justement que la langue naturelle (le français, etc.), de même que le droit, n'exprime pas des propriétés strictement logiques. Notamment, l'interprétation d'une phrase en langue naturelle dépend habituellement de présupposés ; et un présupposé assez courant est que le mariage concerne un homme et une femme. Une façon d'indiquer que ce présupposé ne s'applique pas est de faire figurer explicitement une tautologie généralisant voire contredisant le présupposé. (Je suis sûr qu'un linguiste expliquerait cela bien mieux que moi, je ne suis pas linguiste, etc.)

Quelqu'un qui s'exprimerait purement logiquement dans la vie courante serait proprement insupportable, puisque cette personne devrait sans cesse faire le rappel d'une quantité de présupposés partagés. C'est pourquoi on n'explicite habituellement que ce qui risquerait de différer des habitudes de certains — et, l'existence de mariages entre individus de même sexe différant assurément des habitudes, on est bien ici dans ce cas.

La logique mathématique pure a quelques côtés déroutants. Par exemple, si on prend une hypothèse contradictoire, on a le droit de tout en déduire, même des propriétés elles mêmes absurdes. On m'a ainsi raconté la mésaventure d'une équipe chargée de vérifier le fonctionnement d'un dispositif informatique : elle avait prouvé que si les entrées de ce dispositif vérifiaient certaines hypothèses, alors sa sortie vérifiait une certaine propriété désirée… Sauf que les hypothèses sur les entrées figurant dans la documentation étaient contradictoires ! Ils s'étaient donc retrouvés à démontrer une tautologie « si on se place dans un cas impossible, alors les sorties conviennent ». Une interprétation plus pragmatique, et non purement logique, serait que si l'on demande de démontrer que A implique B, c'est que le cas représenté par A est intéressant, ni absurde ni tautologique, et que donc il convient de s'inquiéter si ce n'est pas le cas.

Bref, il est en général malvenu d'appliquer directement la logique mathématique au langage naturel. Si en plus on le fait en confondant tautologie et contradiction...

samedi, octobre 22 2016

Céline Alvarez et le CNRS de Grenoble

L'ouvrage de Céline Alvarez les Lois naturelles de l'Enfant agace beaucoup dans les milieux de l'éducation. Xavier Molénat a publié sur Twitter une série de remarques et d'extraits, dont celui-ci :

« La première année, malgré l'absence de cadrage institutionnel officiel, le cabinet du ministre et l'académie ont autorisé les tests visant à mesurer les progrès des enfants. Ces derniers ont été réalisés par le CNRS de Grenoble. »

L'ouvrage ne cite cependant pas de rapport ou d'article émanant des chercheurs impliqués dans ces « tests ». Cela ne convient pas à Xavier Molénat, et ne me convient pas non plus. Voyons pourquoi.

Mme Alvarez entend convaincre le lecteur du bien-fondé de certaines thèses en matière d'éducation. Pour cela, elle présente des arguments, dont les résultats de ces fameux tests. Le lecteur est donc censé pouvoir examiner ces arguments. Or, ici, justement, il ne le peut pas.

Que sait le lecteur de ces fameux « tests » ? Qu'ils ont été réalisés par « le CNRS de Grenoble ». C'est vague… Dans quel laboratoire du CNRS à Grenoble ? Par quels chercheurs ? Mystère. S'agit-il du Laboratoire de Psychologie et NeuroCognition (LPNC) ? Celui-ci compte de l'ordre de 50 chercheurs et enseignants-chercheurs « permanents », plus des personnels en contrats temporaires… lesquels étaient impliqués ? Dans quels document ont-ils décrit ces tests et leurs résultats ? Nous n'en savons rien.

Si l'on invoque une étude du CNRS, et non les théories du beau-frère de la coiffeuse, c'est que l'on a une certaine prétention de scientificité. Or, la bonne pratique scientifique est de présenter ses résultats de façon à ce qu'on puisse les critiquer — au sens qu'il doit être possible d'avoir un débat sur les faits et les méthodes. Une étude expérimentale doit décrire précisément ce que l'on entendait mesurer et comment ; car il est toujours possible que les méthodes utilisées laissent prise à des biais, des erreurs, qu'elles n'écartent pas certains facteurs.

Critiquer une méthodologie expérimentale, cela n'est pas dire que les chercheurs ont menti. Il est possible de commettre de bonne foi des imprécisions voire des erreurs : on n'avait pas pensé à un facteur, on n'était pas informé de telle ou telle particularité, on maîtrise mal les statistiques, on a mal compris un travail antérieur, etc. De même, critiquer l'absence d'une référence précise, ce n'est pas insinuer que Mme Alvarez ait inventé ces « tests ». Simplement, les résultats de ceux-ci pourraient ne pas avoir la portée qu'elle leur attribue, et ce même alors qu'elle serait de parfaite bonne foi.

Pour toutes ces raisons, la pratique normale dans les écrits scientifiques est de citer précisément les études sur lesquelles on s'appuie (nom des auteurs, titre, éditeur, etc.). Les références du type « une étude américaine » ou « des expériences de l'INSERM », sans plus de précision, relèvent plutôt de la pratique journalistique. De telles références visent souvent à impressionner le lecteur — on précisera par exemple que le CNRS ou le Massachusetts Institute of Technology sont des organismes prestigieux

Je n'ai pas lu l'ouvrage, et il est périlleux de tirer des conclusions larges de ce qui pourrait être une maladresse isolée. Toutefois, pour reprendre des distinctions de philosophie de terminale, celle-ci donne la désagréable impression qu'il s'agit de persuader le lecteur plus que de le convaincre.

PS : Il y a par ailleurs une certaine incorrection, un certain manque de courtoisie, à ne pas nommer les auteurs d'une étude scientifique. Il s'agit là non seulement de rendre hommage à un travail (comme pour les techniciens au générique d'un film), mais aussi à la réflexion qu'il y a derrière — je doute que ces « tests » aient le caractère standardisé et automatisable d'un test de groupe sanguin. Sauf dans de rares cas, une étude réalisée par un organisme comme le CNRS n'est d'ailleurs pas publiée comme la position de l'organisme, mais comme le travail de chercheurs désignés nommément, et qui engagent d'ailleurs leur réputation.

PS² : On m'a accusé, sur un réseau social, de répandre de « vagues allégations brouillant la communication » sur un « sujet essentiel » par une « critique sans intérêt et dénuée de bienveillance ».

Ma position est simple : il faut choisir. Si l'on écrit en se parant du prestige de la science et de ses institutions (références aux neurosciences, études par des IRM, mention d'organismes prestigieux comme le CNRS ou le Collège de France), il faut jouer le jeu scientifique, c'est-à-dire que l'on doit donner au lecteur les éléments de réflexion, par une référence précise des travaux concernés. À l'oral, bien sûr, ce n'est pas toujours possible, mais lorsqu'on rédige un ouvrage on peut, on doit, faire l'effort.

La bienveillance, en la matière, serait de ne pas critiquer trop vertement, et surtout pas en public, un travail d'étudiant qui ne citerait pas correctement ses sources — ce serait reprocher à l'étudiant de ne pas avoir déjà acquis une compétence qu'il est justement censé acquérir en faisant un travail de recherche. En revanche, je ne vois pas pourquoi on devrait étendre cette licence à une personne qui s'expose dans l'arène publique en publiant un ouvrage se voulant sérieux.

Ce n'est pas rendre service au public que de laisser passer ce genre de références incorrectes aux travaux scientifiques. À ce sujet, je trouve très significatif que l'on m'accuse de « brouiller la communication »... Est-ce à dire que sur ce sujet on « communique » plutôt que l'on ne cherche à fournir une information précise ?

vendredi, octobre 14 2016

Frédéric Beigbeder, cet être complexé

J'ignorais que Frédéric Beigbeder fût humoriste. Enfin, était-ce de l'humour, ou parlait-il sérieusement, quand il expliquait sur France Inter que ceux qui conçoivent des algorithmes — ces fameux algorithmes derrières les services Internet — sont des frustrés sexuels, d'anciens forts en maths boutonneux, bref, des gens pénibles et chiants, par opposition aux « hédonistes » dont il prétend faire partie.

Je conçois que l'on puisse souffrir d'un complexe d'infériorité envers les « forts en maths » et les gens qui savent ce dont ils parlent quand ils parlent d'algorithmes, et que l'on puisse, à 51 ans, vouloir se venger de ses petits camarades de lycée meilleurs que soi. Je conçois plus difficilement qu'une radio publique puisse se prêter à pareil exercice, digne d'un scénario de série américaine pour adolescents — mais oui, vous savez bien, le héros bien dans sa peau et athlétique flanqué d'un geek binoclard ! Mais surtout, j'aimerais un peu régler son compte à cet « hédonisme » en peau de lapin que nous vante Beigbeder.

Le jeune « hédoniste » à la Beigbeder, c'est le jeune homme — ou la jeune fille — de bonne famille, pas inquiet quant au succès de ses études car papa-maman seront là pour payer, qui n'a pas besoin de travailler, sort en boîte, va dans des fêtes, essaye des drogues. Ce n'est pas lui qui nettoie son vomi un lendemain de « murge » — il y a pour cela une France plus basanée et qui se lève plus tôt. Il peut considérer comme de « vieux cons » ses voisins qui protestent contre le bruit de ses fêtes — vu que lui n'a pas à se lever à 4h du matin quand le bébé hurle puis à 7h quand il faut préparer l'aînée pour l'école.

L'hédoniste plus âgé, lui, peut par exemple sniffer de la cocaïne sur le capot d'une voiture. S'il se fait prendre et poursuivre en justice, en bon privilégié pour qui les problèmes ne doivent arriver qu'aux autres, il s'en prend publiquement au Procureur de la République pour avoir subi (et encore, pas en version grave) ce que les autres toxicomanes subissent sans qu'on leur tende le micro ou la plume pour s'en plaindre.

Vous l'aurez compris, les petits cons privilégiés me fatiguent. Porcherie !.

PS Je ne porte pas de lunettes, n'ai pas eu de problème particulier d'acné, et ai, comme ma consœur Charlotte Truchet, une vie sexuelle satisfaisante (mais pas avec elle).

jeudi, octobre 13 2016

Ces algorithmes qui nous gouvernent II

(Suite de mon billet précédent.)

Le « pouvoir des algorithmes ». Les « algorithmes qui nous gouvernent ». « Algorithmes », un mot naguère inconnu des journalistes, maintenant en couverture.

Ce qui me dérange le plus dans cette déferlante médiatique, c'est qu'on mélange des choses assez différentes, allant de « l'admission post-bac » à la recherche de terroristes. Les « algorithmes », c'est vaste, leurs modes de fonctionnement et leurs domaines d'applications sont très divers. Je ne sens pas cette différenciation dans les articles consacrés au sujet, qui pour toute explication se bornent souvent à une définition générale « à la Wikipédia », quand bien même il font appel à un professeur au Collège de France pour dire ce que toute personne cultivée sur ce sujet dirait.

Des « algorithmes » de classement de candidats, on en connaît depuis longtemps. Prendre des notes, les multiplier par des coefficients, classer les candidats selon le total ainsi obtenu, voilà un algorithme. Que celui-ci soit appliqué à la main, avec une calculatrice, avec un tableur ou au travers d'un site Web ne change rien.

La vraie différence est que les algorithmes classiques de classement sont connus — on connaît les coefficients des différentes épreuves, des différentes disciplines — alors que, par exemple, le logiciel de l'admission post-bac était récemment tenu secret (et encore maintenant on n'en connaît que les grandes lignes). C'est ce secret qui pose problème.

On utilise parfois des algorithmes assez complexes pour choisir « la meilleure solution » — on parle alors d'« optimisation ». Par exemple, on pourra vouloir chercher pour une école le meilleur emploi du temps (sous la contrainte qu'on ne doit pas mettre deux cours dans la même salle en même temps, ou avec le même enseignant, etc.), pour un parc de centrales électriques les meilleures périodes d'arrêt pour travaux… ou pour une ligue de football le meilleur calendrier de matchs. La méthode de résolution peut être très compliquée et sa compréhension réservée à des spécialistes (on paye des chercheurs et des ingénieurs spécialisés pour cela !), mais ce qui est pertinent pour le public c'est le critère que l'on optimise, ce qui permet de juger qu'une solution est meilleure ou pire qu'une autre. Par exemple, lors de l'optimisation de rythmes de travail, a-t-on tenu compte de la pénibilité pour les personnels, ou seulement du profit pour l'entreprise ?

Les algorithmes basés sur l'apprentissage automatique sont bien différents. Avec eux, au lieu de définir à l'avance des critères d'évaluation, quitte à les tenir secrets, on les fait fixer automatiquement par observation d'exemples. Non seulement l'opérateur humain n'a pas directement fixé les critères, mais il n'est souvent pas non plus en mesure de les expliquer.

Ainsi, à mon sens, il faut bien distinguer deux problèmes différents :

  1. Les concepteurs du système connaissent les critères que celui-ci appliquent, mais les tiennent secrets.

  2. Le système est trop complexe pour que ses concepteurs comprennent vraiment les critères qu'il applique.

Une critique raisonnée des algorithmes devrait bien distinguer ces deux aspects, et réintroduire le politique là où l'on ne voit que technique aveugle. Le choix des critères appliqués par un algorithme est politique, de même que le choix de garder ces critères secrets. Il est vrai que lorsque l'on ne veut pas assumer ses décisions, il est commode de pouvoir invoquer « le choix de l'ordinateur », comme d'ailleurs « des raisons juridiques ». C'est cela qui mine nos sociétés, plus que l'informatique.


mardi, octobre 11 2016

Ces algorithmes qui nous gouvernent

J'ai lu l'article « Ces algorithmes qui nous gouvernent » paru dans le Point du 22 septembre 2016. Certains de mes collègues me l'ont décrit comme décevant ; certes, on peut déplorer quelques raccourcis, ainsi que le lieu commun assez démagogique du caractère d'« abstractions inintelligibles » des mathématiques. Je n'ai rien vu de choquant ; j'aimerais toutefois revenir sur l'introduction de cet article.

« Le 9 septembre, Erna Solberg, chef du gouvernement norvégien, poste sur son compte Facebook le célèbre cliché d'une petite fille brûlée au napalm, pris pendant la guerre du Vietnam par le journaliste Nick Ut. En 1973, cette image avait valu à son auteur le prix Pulitzer de la photographie. En 2016, ce même cliché, aussitôt mis en ligne, est censuré par Facebook au nom des règles du plus grand média mondial sur… la nudité. L'algorithme du réseau social, qui avait déjà confondu art et pornographie en censurant le tableau « l'origine du monde », vient donc aujourd'hui de confondre pornographie et Histoire. »

J'ignore, pour ma part, si les décisions de Facebook de retirer tel ou tel contenu comme pornographique sont le fait d'un algorithme de reconnaissance de formes, d'employés appliquant une grille de critères, ou d'une combinaison des deux, peut-être opérant sur la base de réclamations. J'ignore d'ailleurs si les auteures de l'article, Violaine de Montclos et Victoria Gairin, ont plus d'informations que moi à ce sujet, ou si elles ont extrapolé de la mode actuelle de voir partout les dangers des « algorithmes » que cette décision serait algorithmique. Je pense, surtout, que cela n'a guère d'importance, car en l'espèce il n'y a pas de différence entre une règle algorithmique appliquée par un ordinateur et une règle bureaucratique rigide appliquée par un humain.

Facebook a des règles d'utilisation prohibant la pornographie ainsi que les photos de nus d'enfant. L'origine du monde, faut-il le rappeler, montre le sexe d'une femme cuisses écartées, son visage absent. Quant aux photographies de nus d'enfants, on les associe de nos jours volontiers à la pédophilie.

Mais, dira-t-on, il ne s'agit pas de cela. Certes, la pose du tableau de Courbet est digne du porno hard, mais il s'agit d'une œuvre présentant un intérêt artistique et historique. Certes, la petite fille fuyant le napalm est nue, mais il s'agit d'une photographie présentant un événement historique. Et en effet, un critère de détermination du caractère obscène d'une œuvre, utilisé notamment aux États-Unis, est l'absence de caractère artistique, historique ou éducatif, l'œuvre ne visant qu'à l'excitation sexuelle. Clairement, ces deux documents n'auraient pas dû être censurés.

« Clairement » ? Comment distinguer l'œuvre de Courbet d'une vulgaire photographie exhibitionniste ? La pose serait la même, et l'on ne saurait recourir à un critère comme la distinction entre peinture et photographie. Il faut faire appel à l'histoire de l'art. Or certes œuvres ont été jugées pornographiques à leur sortie par certains avant d'être réhabilitées, par exemple Madame Bovary ; certaines photographies de Robert Mapplethorpe, et plus généralement une partie de l'art contemporain, seront jugés par les uns comme des œuvres d'arts et par d'autres comme de pornographie répugnante.

Facebook est un hébergeur gratuit, qui sert un très grand nombre de clients. Les ressources qu'il peut allouer à une décision de retrait de contenu sont limitées pour de simples raisons économiques. Il doit donc passer par des procédés algorithmiques, ou par une prise de décision simple par des personnels peu qualifiés et appliquant une grille uniforme. Bien entendu, on ne saurait attendre de ces personnels qu'ils connaissent la tradition artistique de chaque pays dans lequel Facebook est disponible et ce qui y est ou non considéré comme une grande œuvre (je suis certes bien conscient que nous sommes européocentristes en matière d'art et que nous considérons qu'un indien devrait savoir que l'Origine du Monde est une œuvre importante tandis que nous ignorons tout de l'art de son pays). Par ailleurs, avoir une grille simple, uniforme et objective limite les opportunités de contestation — « je ne comprends pas, vous avez admis telle photographie de nu mais pas la mienne ».

Tout cela n'a pas grand-chose à voir avec l'algorithmique, mais plutôt avec la bureaucratie. C'est un trait de la bureaucratie que d'avoir des règles uniformes et rigides applicables par des personnels peu qualifiés (j'entends par là en l'espèce qu'ils n'ont pas de master en histoire de l'art), et qui peuvent produire occasionnellement des résultats ridicules. D'ailleurs, quand les règles ne sont pas suffisamment uniformes et rigides, ou appliquées avec subjectivité, on accuse les personnels de rupture de l'égalité entre usagers…

Je suis d'ailleurs tout à fait d'accord avec la conclusion de l'article, qui explique notre défiance envers les algorithmes par une tendance à « imputer aux mesures ce que, en réalité, nous leur avons demandé de faire »… Cela fait une bonne vingtaine d'années que je vois des articles de presse déplorer l'accès facile à la pornographie en ligne, décrite comme un danger pour les adolescents voire pour les adultes. La pédopornographie est perçue comme un fléau social majeur ; la loi française impose d'ailleurs aux hébergeurs de contenus le retrait immédiat des contenus pédopornographiques, alors que pour d'autres contenus illicites, par exemple diffamatoires, il faut normalement l'intervention d'un juge. Comment, dès lors, s'étonner et s'offusquer de ce que Facebook mette en œuvre des procédures rapides pour supprimer les documents pornographiques, ou, pire, pédopornographiques ? Gageons que s'ils le faisaient pas, Le Point déplorerait le laxisme des pouvoirs publics envers les grandes plates-formes Internet et l'inaction de ces dernières…

Ainsi ces actions de Facebook sont la conséquence prévisible de demandes sociales, et non l'illustration d'une quelconque « prise de pouvoir par les algorithmes ». Ces demandes sociales sont la mise à disposition d'un service à la fois family-friendly et gratuit — d'où une censure low cost et ne s'embarrassant pas de subtilités. Mais, comme souvent dans les affaires politiques, on se plaint des conséquences de ce que l'on a réclamé !

vendredi, juillet 22 2016

Les solutions à tout

Suite aux attentats, divers politiciens et éditorialistes s'en donnent à cœur-joie de proposer de nouvelles mesures ou de donner des avis dont ils prétendent que s'ils avaient été suivis il n'y aurait pas eu de carnage. On peut sourire des idées de certains (des militaires avec lance-roquette prêt à être tiré en faction dans les avenues fréquentées), que l'on attendrait plutôt de la part d'adolescents que d'homme mûrs. On rit moins lorsque l'on sait que ces gens ont, pour une part, le pouvoir de transformer ces idées en lois et en mesures.

Deux billets précédents n'ont pas pris une ride :

La racine du problème semble être que, face à une menace (réelle ou imaginaire, exagérée ou non), le responsable politique se doit de proposer des mesures, que celles-ci soient efficaces ou non, qu'on puisse ou non les mettre en place.

Il semble que ce comportement soit motivé par la croyance que c'est ce que le public attend. Cette croyance est-elle justifiée ? Le public attend-il vraiment qu'on lui propose n'importe quoi ?

jeudi, juillet 14 2016

Rhétorique de conviction

Un avocat connu pour son blog et sa présence sur les réseaux sociaux s'est récemment répandu contre la prétention que l'on puisse prédire l'avenir grâce à des algorithmes. Ayant rappelé la définition de ce concept (la description finie d'un procédé de calcul à l'aide d'opérations élémentaires, de tests, de boucles…), il en déduisait comme une évidence qu'il était impossible de prévenir l'avenir de cette façon. S'en est suivi une conversation entre moi et un interlocuteur anonyme, conversation qui, il me semble, est intéressante, au-delà du cas d'espèce, pour l'illustration de mécanismes psychologiques et rhétoriques, et que je me propose donc de résumer ici.

Le dialogue

D.M. : On prédit pourtant l'avenir avec des algorithmes : par exemple, on prévoit des années à l'avance la trajectoire des engins spatiaux, les services de météorologie prédisent le temps qu'il fera…

Anonyme : Vous confondez lois sociales et lois physiques.

D.M. : Vous voulez des exemples sociaux ? La société Google a eu le succès que l'on sait notamment de part sa capacité à assez bien prédire qu'est-ce qui sera considéré comme pertinent par les lecteurs.

Anonyme : Il s'agit d'une société privée, à but lucratif et aux visées transhumanistes !

D.M. : La nature de cette société où les éventuelles visées de certains de ses dirigeants n'enlèvent rien à ses capacités techniques.

Anonyme : Au contraire, cela a un rapport énorme ! Qui plus est, je ne crois rien sans preuve, et en matière de logiciels, la preuve passe par des tests unitaires !

D.M. : Bonne soirée.

Maintenant, mon commentaire.

Motte-and-bailey

Lorsque l'on énonce des faits généraux, comme par exemple qu'on ne peut prédire l'avenir à l'aide d'algorithmes, on se doit normalement de qualifier la portée de ces faits. Si l'on entend parler de l'impossibilité de prédire algorithmiquement l'avenir d'un être humain ou d'un groupe d'êtres humains, par opposition à celui d'objets bien décrits par des lois physiques, il convient de dire que l'on ne parle que des faits sociaux. Sans cela, on entre dans une conversation assez déplaisante où l'un énonce pompeusement des « vérités » de grande portée, est démenti, puis se plaint d'avoir été mal compris et que bien entendu ce n'était pas ce qu'il voulait dire.

Certains auteurs anglophones appellent ce procédé rhétorique motte-and-bailey par analogie avec la défense des châteaux médiévaux : on commence par vouloir accaparer un large territoire conceptuel ou rhétorique, mais lorsque l'interlocuteur presse, on se retranche dans son château sur la butte avec un énoncé bien plus restreint.

Confusion entre la véracité et la moralité des faits

Il devrait être évident que l'on peut prétendre qu'un fait est avéré sans considérer qu'il est bon pour la société ou considérer que les personnes qui en sont à l'origine ont agi moralement. Ainsi, dire que le Parlement a voté une loi n'implique pas que l'on considère que cette loi est appropriée ou bonne, ou encore moins que l'on considère que les parlementaires sont particulièrement moraux.

Pourtant, ici, on a cru bon de contredire le fait que la société Google pouvait, d'une certaine façon, prédire l'avenir, en m'objectant que cette société est privée, capitaliste et à visées transhumanistes. Quel rapport ? Ce n'est pas parce que nous n'aimons pas la perspective de quelque chose, ou les objectifs de ceux qui l'accomplissent, que celle-ci est impossible.

Une autre anecdote. Il y a quelques années, j'avais expliqué sur ce blog pourquoi je croyais que les instances dirigeantes d'une organisation (instances dont je ne faisais pas partie, mais dont je connaissais assez bien la mentalité, les objectifs et les modes de raisonnement) allaient décider en un certain sens. J'ai alors été violemment pris à partie comme si c'était moi qui avais tranché ! Comme si, en quelque sorte, estimer quelque chose se passera revenait à considérer que cette chose soit souhaitable, bénéfique, voire à avoir pris part à la décision.

L'épouvantail du transhumanisme

Je suis assez fatigué d'entendre parler des dangers du « transhumanisme », qui serait la mentalité des « ingénieurs de la Silicon Valley ». Certes, certains entrepreneurs des hautes technologies, notamment Ray Kurzweil, font des déclarations en ce sens. Il convient cependant de se rappeler que ces gens, dans une optique entrepreneuriale américaine, doivent faire rêver, notamment pour attirer des investisseurs et des employés de premier choix. Autrement dit, ils doivent proposer des objectifs très ambitieux ; on se rappellera du président Kennedy s'exclamant « To the Moon ! » pour lancer le programme lunaire. On doit cependant également se rappeler que cette rhétorique hyperbolique masque parfois des réalités décevantes : par exemple, on annonçait comme une révolution un produit mystérieux… le Segway.

Il existe à mon avis des problèmes bien plus pressants que le transhumanisme, y compris en matière d'usage des technologies numériques. Pourtant, celui-ci semble obséder certains milieux. Je ne comprends guère.

Je suis notamment troublé que l'on prenne pour argent comptant les déclarations d'entrepreneurs « transhumanistes », tout en dénonçant leur duplicité. D'une part on dit que ces gens sont des menteurs qui promeuvent l'impossible, d'autre part on dit qu'ils ont des projets dangereux. D'une part on les taxe d'une grande naïveté, d'autre part on leur attribue une grande adresse — un peu comme ces méchants de James Bond, aux moyens infinis et à la cruauté raffinée, mais qui laissent s'échapper le héros.

Vérité et prouvabilité

Il est vrai que l'on peut prouver la correction d'algorithmes et de programmes ; c'est d'ailleurs, cela tombe bien, ma spécialité de recherche et d'enseignement (et je suis d'ailleurs très réservé quand on m'explique qu'on fait cela par des « tests unitaires »). Une grande difficulté, voire limitation, de cette approche, c'est que très souvent on n'a pas de spécification mathématique claire de ce que l'algorithme doit faire. Dire qu'un algorithme doit rendre en sortie son entrée triée par ordre croissant, cela peut être mathématiquement précis ; dire qu'il doit reconnaître une photo d'homme d'une photo de femme, c'est plus délicat, car on n'a pas de caractérisation mathématique de ce qu'est une photo d'homme ou de femme. Autrement dit, quand on touche aux faits humains ou sociaux, on peut souvent oublier toute possibilité de prouver l'efficacité finale de l'algorithme. (Cela n'exclut pas, bien sûr, de pouvoir montrer des propriétés mathématiques intéressantes, mais dont le lien avec la réalité sociale est discutable.)

En ce qui concerne la société Google, je me borne à constater que son cœur de métier original est de retrouver ce qui est pertinent pour le lecteur, autrement dit à prédire avec un certain succès que tel document pourrait l'intéresser tandis que tel autre non. Bien entendu, cette prédiction n'est pas parfaite, et on peut se gausser des erreurs de ciblage des automatismes de l'Internet (par exemple, cette régie publicitaire qui, un temps, me proposait des publicités pour produits destinés à l'hygiène des organes génitaux féminins externes). Il n'en reste pas moins que l'on sait faire des choses.

Constatons également ici des injonctions contradictoires. On explique tout d'abord que le monde social est d'une complexité telle que, contrairement à la mécanique simple des trajectoires spatiales, il est inaccessible à la description mathématique et à la prédiction algorithmique ; puis on reproche aux algorithmes destinés à l'étudier de ne pas venir avec une preuve de correction par rapport à une description mathématique dont justement on nie l'existence !

Militantisme et rhétorique grandiloquente

Dans le militantisme et, plus généralement, les convictions politiques, il y a souvent

  1. la rhétorique grandiloquente, emphatique et plein de grands principes souvent assez creux

  2. la confusion entre ses désirs et la réalité

  3. la tendance à donner des leçons (que l'on pourrait qualifier de splaining, suivant un mot à la mode) sur tout sujet, à partir du moment où celui-ci se relie aux convictions politiques et morales défendues

  4. la tendance à partir dans la morale lorsque l'on perd pied sur les faits.

Là, je pense avoir été servi.

(Mea culpa – je pense moi aussi faire preuve de ces quatre travers lorsque je parle de sujets politiques.)

Critique de la gouvernance algorithmique

Il existe pourtant des critiques fort valables des la prédiction algorithmique. À mon avis, le bon argument n'est pas que l'on ne peut pas prédire l'avenir à l'aide d'algorithmes — puisqu'on le peut, avec une bonne probabilité, dans bon nombre de cas. Les bons arguments me semblent plutôt :

  1. Les critères de prédiction identifiés peuvent être des prophéties auto-réalisatrices et leur utilisation aveugle pourrait être contre-productive. Par exemple, il est possible que le fait d'être plutôt pauvre et d'habiter dans certains quartiers prédispose plus au vol à la tire que de naître dans une famille de cadres supérieurs ; et il est plausible qu'un algorithme d'apprentissage automatique constate cela si on lui soumet un corpus de délinquants vs non délinquants. Faut-il en conclure qu'il faut, au moment d'embaucher un personnel, favoriser les enfants de cadres supérieurs ?

  2. Les prédictions sont des tendances statistiques qui doivent donc être analysées statistiquement. On sait bien, par exemple, qu'un procédé même précis appliqué en masse pour dépister un phénomène rare donnera surtout des faux positifs.

  3. Ce n'est pas parce qu'un résultat est produit par un procédé algorithmique qu'il est correct. Les procédés algorithmiques incluent des biais, que ce soient ceux de leurs concepteurs ou ceux induits par le fonctionnement d'algorithmes d'apprentissage. D'ailleurs, il est rare que l'on puisse appliquer à l'aveugle des techniques d'apprentissage automatique sans d'importants réglages demandant la collaboration d'experts en apprentissage et d'experts du domaine étudié.

- page 1 de 26