Snelling Road Race • Feb 22 2020 • Snelling, CA — Photo by Katie Miu

Prevendo ganhadores em corridas de ciclismo com Machine Learning

Com 95% de precisão, pode-se utilizar dados históricos de desempenho para prever quais atletas estarão no pódio

Um pouco de contexto do projeto

Primeira versão — Race Field Analysis

Race Field Analysis — Tela de análise e previsão da corrida The Tour of St. Louis
Women Cat 3 Podium • Snelling Road Race

Covid-19

Zwift

Image credit: Zwift

Segunda versão — ZRace

ZRace — Tela de análise e previsão da corrida 3R Figure 8 Hilly

Por baixo do capô — Modelos estatísticos

As iterações do modelo preditivo foram:

Resultados

Random Forest Feature Importance
ZRace — Resultado vs Previsão

Conclusão

  • Trabalhar neste projeto foi bem divertido, poder comparar as previsões com os resultados finais das corridas te mostra um benefício imediato e real e isso é bem motivador.
  • Por mais que eu esteja bem feliz com os resultados atuais, vou continuar colhendo os dados das corridas para chegar ao número mágico de 10.000 amostras (corridas) e assim realizar mais uma bateria de treinamento dos modelos. Creio que devo testar novos algoritmos também incluindo Neural Network.
  • A primeira versão do projeto desenvolvida para corridas não virtuais foi um passo importante de aprendizado para o desenvolvimento da segunda versão com foco em corridas no Zwift. Mas ela hoje está bem desatualizada, tenho planos para revisitá-la assim que as corridas voltarem a ocorrer e aplicar todo conhecimento adquirido na ZRace.
  • Analisando o gráfico de importância do modelo RF, uma variável me deixou bastante intrigado. O peso do atleta tem um alto fator nas decisões do modelo. Teoricamente sabemos da importância do W/kg e FTP no ciclismo, mas o peso por si só é uma nova informação. Será que explorando os dados posso chegar ao peso ideal de um super ciclista? Caso eu chegue a uma resposta, este pode ser assunto para um próximo artigo.
  • Até o momento todo feedback sobre a ferramenta e os benefícios das informações apresentadas por ela aos atletas antes e depois das corridas são positivos. E isso é bem recompensador. Por favor, fique a vontade para comentar, sugerir mudanças, funcionalidades, entre outros. Todo feedback é bem vindo.

Entrepreneur, Product Manager, and Engineering Leader. Enthusiast of Data-Driven Products and Data Science. From Brazil to Silicon Valley

Love podcasts or audiobooks? Learn on the go with our new app.