Tout le monde a déjà parlé de Nate Silver, cet analyste américain qui, s'appuyant sur des statistiques et un modèle mathématique assez simple (accumuler les résultats de sondages en privilégiant les plus récents et les plus fiables), a prédit correctement les 50 états de l'élection présidentielle américaine, après des succès pour d'autres élections et le baseball.

Je me demande quel est le sens à accorder aux « chances » affichées, du type « Obama a 80% de chances de gagner, Romney 20% ». Pour moi, c'est un modèle bayésien : il s'agirait en quelque sorte de probabilités conditionnées par les observations précédentes, avec comme espace des évènements les votes pour tous les électeurs. Dans ce cas, quelle est la distribution initiale supposée (et a-t-elle même une quelconque importance) ? Chaque électeur a une probabilité indépendante 50/50 de voter pour l'un ou l'autre ?

En revanche, je n'arrive pas à attribuer une interprétation fréquentiste. Si Silver s'était contenté de donner un chiffre pour Obama avec un intervalle de confiance, aucun problème (interprétation fréquentiste : si on refaisait un très nombre de fois les sondages et on appliquait l'algorithme de Silver, on obtiendrait plus d'une certaine proportion des résultats dans l'intervalle de confiance), mais là, je ne vois pas.