Catégories
Paris sur le Tennis

Tennis Match Prediction – Accueil

Notre tâche pour ce projet était de créer un modèle d'apprentissage automatique pour prédire avec précision le résultat d'un match de tennis entre deux joueurs donnés. Nous avons choisi ce projet en raison de notre intérêt personnel pour le tennis ainsi que de la popularité mondiale du sport. Le tennis est l'un des sports les plus regardés et les plus misés au monde, nous étions donc intéressés à construire un modèle pour prédire les résultats et voir comment il se compare aux cotes des paris. Nous avons testé plusieurs algorithmes d'apprentissage automatique, notamment des arbres de décision, des réseaux de neurones, des classificateurs Naive Bayes, des k-voisins les plus proches et une régression logistique. Notre jeu de données d'entraînement contenait 16 229 matchs ATP de 2000 à 2014, et notre jeu de données de test contenait 2 271 matchs ATP de 2015 au début de 2017. Les jeux de données comprenaient des attributs tels que la surface du terrain, le classement des joueurs, l'âge, la souplesse et plus encore.

Nous avons constaté que de toutes les approches que nous avons testées (expliquées plus en détail dans notre rapport complet et consultables dans les résultats complets), le classificateur Naive Bayes fonctionnait le mieux, donnant une précision de test de 72,2% sur l'ensemble des correspondances ATP à partir de 2015 (logistique simple la régression était la deuxième meilleure avec 71,8%). Nous pensons que cela peut s'expliquer parce que, bien que l'hypothèse d'interdépendance puisse être légèrement violée par l'ensemble de fonctionnalités, nous avons calculé certains attributs qui étaient des prédicteurs indépendants très forts pour le résultat du match, à savoir le différentiel du journal de chaque joueur. rang, le différentiel du journal des points de rang de chaque joueur et le pourcentage de victoire en tête-à-tête. Notre précision est comparable à celle obtenue par des groupes de recherche universitaires étudiant l'utilisation de l'apprentissage automatique pour prédire les matchs de tennis, nous pensons donc que le projet a été un succès.

  Paris sur le tennis à Wimbledon 2020 - Jeux en ligne à Wimbledon

Le classement des joueurs était l'attribut le plus important de notre modèle, mais nous avons spécifiquement examiné la différence des journaux naturels du classement des joueurs [ln(p1rank) – ln(p2rank)] pour tenir compte du fait que le rang est plus significatif lorsque le joueur classé n ° 1 dans le monde joue le n ° 10, contre le n ° 100 jouant le n ° 110. Après le classement, nous avons trouvé la différence des logs naturels des points de classement des joueurs [ln(p1rankpoints) – ln(p2rankpoints)] être significatif. Les points de classement d'un joueur au cours des 52 dernières semaines déterminent son classement ATP actuel, mais nous soupçonnons que cela était légèrement plus faible en tant que prédicteur, car il pourrait y avoir une grande différence entre les points de classement de deux joueurs de tennis moins importants (c.-à-d. une plus petite différence dans leur classement, de sorte que le différentiel de classement refléterait mieux la différence dans leurs capacités de jeu. Enfin, le classement en tête-à-tête était utile dans certains cas, mais dans de nombreux cas, les deux joueurs ne s'étaient jamais rencontrés auparavant, nous avons donc fixé le pourcentage de victoires de chacun de ces joueurs à la médiane de 50%, ce qui a légèrement biaisé l'ensemble de données .

Tennis Match Prediction – Accueil
4.9 (98%) 32 votes