Modelo matemático calcula as probabilidades de todos os confrontos da copa!

Tentar prever o resultado de eventos esportivos é uma prática super comum, mas extremamente complexa. O número de variáveis envolvidas e o peso de cada uma delas é algo difícil de ser mensurado. Além disso, é primordial que o modelo seja testado para garantir a aderência à realidade, utilizando cenários com resultado conhecido. Com isso em mente, foram levantadas variáveis que impactam no resultado de partidas de futebol (desde histórico recente de jogos até o peso da camisa, quantificado no modelo pela quantidade de partidas que cada seleção jogou em copas do mundo, por exemplo) e construído um modelo para prever o caminho percorrido por cada seleção na Rússia.

Este insight traz os resultados desse estudo e explica um pouco mais sobre como esse modelo foi construído.

Afinal, de que depende o resultado de uma partida? – As variáveis utilizadas para o cálculo do modelo

Elenco, poder de decisão, tradição, peso da camisa, craques, poderio ofensivo, solidez defensiva, meio de campo criativo, laterais que defendem e apoiam, goleiro que transmite segurança, técnico capaz de fazer uma boa leitura do jogo e usar as peças que tem à disposição da melhor forma possível… São inúmeros fatores que pesam para que um time vença uma partida de futebol. Para definir a probabilidade de vitória de cada time por confronto foram utilizadas as seguintes variáveis:

  1. Ranking
  2. Quantidade de participações em copas
  3. Quantidade de partidas disputadas em copas
  4. Quantidade de títulos mundiais
  5. Quantidade de títulos continentais
  6. Resultados das últimas partidas de cada equipe
  7. Quantidade de gols marcados nos últimos jogos
  8. Quantidade de gols sofridos nos últimos jogos
  9. Histórico de confronto direto
  10. Continente de cada time
  11. Fator casa (Performance do time quando joga em casa, fora ou em campo neutro)

 

Com base nessas variáveis, milhares de cenários foram criados, simulando os resultados de cada partida e desenhando o percurso de cada equipe. Para calibrar o modelo, as mesmas variáveis foram testadas para ajustar o modelo com base na copa de 2014. Com o modelo ajustado, foram realizadas 10.000 simulações da Copa de 2014 gerando resultados extremamente coerentes com o resultado da copa.

A prova de fogo – Testando o modelo na Copa de 2014

Os testes de 2014 apontaram a Alemanha como a principal favorita ao título, com 25,1% de chances de ser campeã com a Argentina sendo a segunda equipe com maior probabilidade de título. Mas muito mais que isso, apontou a Argentina como a “favorita” ao vice-campeonato, com 16,5% de chances de ser vice-campeã. Abaixo, vemos os resultados de simulações de título, vice-campeonato, classificação para a final e classificação para as semifinais.

Uma curiosidade dos resultados da simulação de 2014 é o comportamento dos resultados do grupo B, que era composto por Espanha, Holanda, Chile e Austrália. A Espanha vinha de dois títulos europeus e do título mundial de 2010, conquistado justamente contra a Holanda, em uma partida equilibrada, decidida apenas na prorrogação. Para muitos, era uma das principais favoritas ao título mundial. Mas a sorte não sorriu para os espanhóis, que ficaram no grupo da morte, com as fortes seleções holandesa e chilena. Segundo o modelo, a Holanda era a 6ª favorita ao título, o Chile o 7º e a Espanha a 8ª. Porém, como só duas dessas equipes poderiam chegar às oitavas de final, a Espanha tinha mais de 40% de chance de eliminação na fase de grupos – para efeito de comparação, o Equador, numa chave com França, Suíça e Honduras, tinha apenas 30% de chance de eliminação na fase de grupos. Resumindo, o modelo cravou Holanda e Chile como favoritos frente à equipe espanhola. Na prática, vimos uma seleção holandesa que alcançou o terceiro lugar, uma seleção chilena que deu muito trabalho para o Brasil nas oitavas – o Brasil ganhou nos pênaltis e uma seleção espanhola dando o adeus ainda na fase de grupos.

O hexa é logo ali – Aplicando o modelo para simular os resultados da Copa de 2018

Para a copa de 2018, foram realizadas mais de 50.000 simulações, que apontaram o Brasil como principal favorito ao título, sendo campeão em 20,2% dos cenários. A Alemanha aparece como segunda maior favorita ao título, com 16,2% de chances. Espanha com 14,1%, Argentina com 11,9% e França com 10,2% fecham o Top 5. Abaixo, temos os resultados das simulações de título, vice-campeonato, aparições na final e nas semifinais.

Uma outra análise interessante traz os times com maior chance de passar pela fase de grupos. Os cinco times com maior probabilidade de classificação são Brasil, Uruguai, Inglaterra, Argentina e Espanha. Quando olhamos as chances de título, Inglaterra e Uruguai não figuram entre os principais favoritos. A explicação está nas chaves de Uruguai e Inglaterra, que apesar de não chegarem entre as equipes mais badaladas e apontadas como favoritas ao título pelos especialistas, caíram em grupos nos quais o favoritismo é inquestionável. O Uruguai enfrenta a Rússia, a Arábia Saudita o Egito. É difícil imaginar a seleção uruguaia sendo eliminada na primeira fase. Na chave da Inglaterra, o confronto com a Bélgica pode ser complicado, mas também é pouquíssimo provável que o English Team seja eliminado em um grupo com Tunísia e Panamá.

Ainda sobre Uruguai e Inglaterra, o caminho fica bem mais complicado a partir das oitavas de final. O Uruguai, se classificado, enfrenta um time que sairá do grupo B – chave que tem as duas potências ibéricas, Portugal e Espanha. Contra essas duas equipes, a vitória uruguaia é considerada zebra. O modelo aponta o Uruguai com apenas 41,2% de chances de classificação para as quartas de final.

No caso inglês, os dois remanescentes do grupo G – que serão Bélgica e Inglaterra, caso confirmem o favoritismo – enfrentarão os dois remanescentes do grupo H – que na simulação são Colômbia e Polônia. Quem enfrentar a Polônia é favorito a alcançar as quartas de final, onde, no cenário mais provável, enfrentaria o Brasil. Quem enfrentar a Colômbia também é favorito, mas já em um jogo bem mais equilibrado. O vencedor dessa partida tem a Alemanha – que é amplamente favorita no grupo F e no jogo de oitavas de final – nas quartas de final. Resumindo, Inglaterra e Bélgica aparecem muito bem cotadas para se classificar para as oitavas, apesar disso, pela dificuldade da chave, o modelo aponta que nenhuma delas deve ser semifinalista.

Leia “32 Curiosidades sobre os países e o resultado do modelo preditivo da copa”

Uma série de fatores pode interferir num jogo de futebol, além dos mencionados nesse insight. Clima, erros de arbitragem, lesões, crises internas nas equipes, falhas na logística, desconcentração por razões externas e inúmeros outros fatores podem impactar na maneira como cada equipe atua e no resultado final das partidas. Apesar disso, os resultados obtidos pelo modelo na simulação de 2014 corroboram a modelagem e as variáveis escolhidas. Agora resta acompanhar e torcer!

 


Sobre os autores

Felipe Pena é consultor da Visagio, especialista em projetos com foco em gestão orçamentária, engenharia de processos e analytics no setor de adquirência e no setor bancário.

Marcus Sousa é consultor da Visagio, especialista em projetos com foco em modelo de gestão, suprimentos e analytics nos setores de varejo, mercado financeiro, indústria metalúrgica e energia. Atua também como líder da área de Research & Intelligence da Visagio, com foco em pesquisas e análises de mercado.