Je n'ai pas le temps ce matin de faire un cours de statistiques, mais j'invite tous ceux qui commentent les récents sondages plaçant Mme Le Pen en tête au premier tour de l'élection présidentielle :

  • À se renseigner sur les intervalles de confiance en statistiques. En très rapide : un sondage, même à supposer que les sondés répondent tous avec une sincérité parfaite et sont choisis au hasard parfait parmi les électeurs, a une « marge d'erreur » dont la taille dépend du nombre de sondés. Vu les nombres habituels de sondés pour les sondages politiques et les faibles écarts entre les trois prétendants, tout ce que l'on peut conclure de tels sondages, c'est que les trois prétendants sont « dans un mouchoir de poche » et non que l'un est devant l'autre.
  • À se renseigner sur les techniques de « correction » ou de « redressement » appliquées par les instituts de sondage, notamment pour les votes Front national (apparemment, les résultats bruts des sondages sous-estiment le vote FN, car les sondés ne répondent pas sincèrement, et les instituts font un peu de cuisine avec les chiffres pour compenser).

(Contrairement à ce que croient souvent des gens sans culture mathématique, il est parfaitement possible d'estimer une quantité par sondage. Le problème est que si on veut être quasi sûr d'avoir une précision à 1%, il faut sonder au moins 4000 personnes, et surtout qu'il faut qu'elles répondent toutes sincèrement — sinon on fait une vraie cuisine, avec des raisonnements du type « lors du sondage, seuls 7% des gens ont admis avoir voté Le Pen aux dernières élections alors qu'il a fait 14%, donc on devrait environ doubler son score », cuisine qui n'a pas de base mathématique...)