Quelque chose à ajouter ? Un pronostic ? Dites-le en commentaire.
C’est parti pour un mois. On ne va plus parler que de ça : la Coupe du monde de football. Les supporters ont sorti leurs drapeaux et sont déjà installés devant leur poste de télévision. Dans les bistrots, les conversations et les pronostics vont bon train. Qui va gagner ? Chacun y va de son pari et lance son doigt mouillé vers les cieux. Pourtant quelqu’un connaît le résultat : c’est une IA pilotée par un groupe de chercheurs européens. Elle a compilé des dizaines de milliers de données, fait tourner plusieurs modèles mathématiques dernier cri, et un résultat est sorti de la boule de cristal digitale. Le gagnant est…
Une équipe de chercheurs composée d’universitaires de la Technische Universitat Dortmund, de l’Université technique de Munich en Allemagne et de l’Université de Gand en Belgique ont utilisé une base de données de statistiques de toutes natures recueillies lors des tournois précédents. Ils ont fait tourner trois modèles d’IA différents pour établir un modèle considéré comme fiable. Celui-ci a calculé 100 000 simulations et est parvenu à établir le classement final de la Coupe du monde 2018.
Avant de consulter les résultats prédits par cette IA, penchons-nous sur les rois des pronostics : les bookmakers. Ceux-ci prédisent, presque à l’unisson, que le champion du monde sera l’équipe d’Allemagne. Ce n’est pas du tout ce que pense l’IA, pourtant pilotée par des chercheurs allemands. Ils se fondent sur leurs modèles mathématiques qui ont intégré non seulement des données statistiques mais aussi des éléments sur la force des équipes et leur parcours vers la finale.
Trois techniques ont été utilisées par les mathématiciens pour traiter les données statistiques. Une classique d’abord, la régression de Poisson qui consiste à interpréter et pondérer des variables de natures différentes. L’autre méthode est celle du classement (ranking method). Elle consiste dans une évaluation de la force actuelle de chaque équipe. Enfin, la troisième méthode est plus récente ; il s’agit de l’approche dite de la Forêt d’arbres décisionnels (random forest method). Elle a été mise au point par les mathématiciens Leo Breiman et Adèle Cutler en 2011. Elle fait partie des techniques d’apprentissage automatique et combine les concepts de sous-espace aléatoire et de « bagging ». L’algorithme effectue un apprentissage sur de multiples arbres de décision entrainés par des sous-ensembles de variables, à chaque fois différentes.
Selon les chercheurs qui ont publié leurs travaux sur le serveur scientifique de prépublication arXiv.org, la méthode la plus adaptée à la Coupe du monde de football est celle de la forêt d’arbres décisionnels. Le modèle est structuré comme un tournoi de football, mais sa touche secrète réside dans la façon dont il utilise l’apprentissage machine pour tracer les branches aléatoires d’un arbre de décision – différents scénarios et leurs conséquences – et ce, plusieurs fois.
En faisant en sorte que l’IA mette l’accent sur différents facteurs lors de la production des arbres de décision, en répétant les simulations et en comparant ensuite les différents facteurs, la méthode de la forêt d’arbres décisionnels peut donner aux statisticiens un meilleur aperçu des facteurs les plus importants dans le résultat final – tels que les adversaires auxquels chaque équipe est susceptible d’être confrontée. De plus, par rapport à d’autres modèles mathématiques, celui-ci fournit également des informations plus précises plus tard dans l’arbre de décision, à un moment où les données sur les équipes pourraient être rares.
Les chercheurs ont branché une foule de données de base pour éclairer leurs modèles. En regardant les tournois précédents, ils ont constaté que certains facteurs étaient importants (comme le nombre de joueurs de la Ligue des champions au sein d’une équipe) et d’autres moins (comme la nationalité de l’entraîneur d’une équipe).
Au bout de 100 000 simulations, les chercheurs sont arrivés à leur conclusion. Selon eux, l’Allemagne ne sera pas victorieuse, comme le prétendent les bookmakers, parce qu’elle a, selon les modèles, beaucoup de chances (on dirait plutôt de probabilité si on veut être fairplay) d’être éliminée en huitièmes de finale car elle est susceptible d’affronter des adversaires difficiles au cours de la compétition.
L’équipe qui arrivera en tête déclare l’IA, c’est…
Avant de donner le résultat, il faut préciser que les chiffres du peloton de tête tiennent dans un petit mouchoir. Et que les statistiques, c’est bien joli, mais le destin n’est pas avare de surprises.
Revenons à notre classement, l’Allemagne ne sera pas championne du monde. L’équipe qui la dépassera et qui pourra élever la coupe du monde sous les éclats des médias et du monde entier est, selon les calculs sophistiqués de l’IA, une équipe qu’aurait pu battre l’Allemagne. L’Allemagne est plus forte qu’elle (disent les chercheurs… allemands) et pourrait la battre en face à face, mais le processus du tournoi fait que l’Allemagne sera éliminée et ne pourra se retrouver seule face à l’équipe que l’IA donne gagnante.
Cessons de faire durer le suspense, le prochain champion du monde 2018 sera l’Espagne.
En deuxième position vient l’Allemagne, puis le Brésil et enfin la France.
Voici le classement complet établi par l’IA :
Les supporters français sont désespérés. Nous les imaginons pleurer à gros sanglots. Mais ils ne devraient pas se décourager si vite. L’IA n’est qu’une machine. Elle donne l’Espagne, soit ; mais a-t-elle intégré les derniers événements comme le renvoi, la veille de l’ouverture de la compétition du sélectionneur espagnol ? Cela ne devrait-il pas déstabiliser l’équipe ? Est-ce dans la boîte noire des algorithmes ? Et puis, que dire du hasard, de l’imprévu, de la chance, du fatum, du petit coup du sort, autant de variables qui n’entrent pas dans les modèles statistiques.
Alors espoir ! Allez les bleus !
S’abonner
Connexion
0 Commentaires
Les plus anciens
Les plus récents
Le plus de votes
Inline Feedbacks
View all comments