Dez mil vezes campeão

Se o campeonato brasileiro de 2011 fosse jogado dez mil vezes, quem seria o campeão mais frequente? Pesquisadores da Universidade de São Paulo (USP) e da Universidade Federal de São Carlos (UFSCar) desenvolveram um sistema que realiza exatamente essa simulação, baseada no desempenho parcial de cada equipe na competição e no prognóstico dos próximos jogos.

O objetivo é tentar determinar as chances de cada time de conquistar o título desta temporada, uma vaga na Copa Libertadores ou na Copa Sulamericana e de escapar do rebaixamento para a série B. 

As previsões, disponíveis no site Previsões Estatísticas, utilizam uma modelagem realizada em dois estágios. Primeiro, o sistema define um modelo estatístico para formular as taxas de gol de cada time em cada partida. Essa variável é influenciada por três fatores: mando de campo, ataque e defesa dos dois adversários. 

Todos os confrontos futuros do campeonato são simulados dez mil vezes, considerando todas as possibilidades deresultados

Todos os confrontos futuros do campeonato são, então, virtualmente simulados dez mil vezes, considerando todas as possibilidades de resultados. Assim, é possível avaliar as chances de cada equipe conquistar seus objetivos e determinar o intervalo provável de pontos que deve ser alcançado por cada time ao final da competição.

“O sistema valora automaticamente o ataque e a defesa dos times a partir do seu desempenho prévio na competição, a quantidade de gols que marcou e que sofreu”, afirma o estatístico Francisco Louzada, pesquisador do Instituto de Ciências Matemáticas e de Computação da USP e coordenador da pesquisa. 

“O mando de campo tem impacto diferente para cada equipe. Levamos em consideração o bom ou mau desempenho dos clubes como mandantes e como visitantes”, explica o estatístico.

Caixinha de surpresa

Uma das características mais valorizadas do futebol é sua imprevisibilidade. Recentemente, uma pesquisa dos Estados Unidos apontou o velho e rude esporte bretão como o mais imprevisível do mundo.

Para Louzada, a possibilidade mais interessante apresentada pelo sistema é justamente sua proposta de simular esse caráter aleatório, a partir da determinação não apenas de números fixos, mas do intervalo de pontos médio que cada time deve alcançar ao final da competição. 

“Entre as dez mil simulações que realizamos, estão incluídas todas as possibilidades de resultados. Os intervalos prováveis de pontuação final das equipes são calculados a partir da média de pontos acumulados por cada uma em 50% das simulações”, explica o pesquisador.

“A cada rodada, as previsões são reajustadas com base no desempenho das equipes, aumentando sua precisão ao longo da competição.”

Tabela campeonato brasileiro
As barras coloridas mostram os intervalos médios de pontuação final de cada time, obtidos em 50% das simulações, um dos diferenciais da abordagem estatística utilizada. (imagem: USP e UFSCar)

Para o pesquisador, o modelo se diferencia das inúmeras previsões que inundam as páginas esportivas dos jornais nas rodadas finais do campeonato justamente por considerar a imprevisibilidade do futebol. 

“A modelagem de diversos desses sistemas não é clara ou sequer conhecida. Além disso, muitas vezes baseiam-se numa abordagem puramente matemática, determinística, que não considera os aspectos aleatórios do esporte”, avalia.

Campeão de 2011

As previsões do sistema após a 35ª rodada do Brasileiro 2011 apontam o Corinthians como favorito ao título, com 80,3% de chances de ser campeão, seguido por Vasco (18,5%), Fluminense (1%) e Figueirense (0,2%).

As previsões do sistema apontam oCorinthians como favorito ao título, com 80,3% de chances de ser campeão

A análise do intervalo provável de pontos finais dos atuais líder e vice-líder, no entanto, ainda revela uma situação de ‘empate técnico’. “Em 50% das simulações realizadas, a pontuação final obtida por Vasco e Corinthians foi bastante parecida, variando de 66 a 69 pontos para o primeiro e de 68 a 71 pontos para o segundo”, conta Louzada. 

Segundo o estatístico, na briga pelas vagas na Libertadores, Fluminense, Figueirense, Botafogo e Flamengo também apresentam intervalos finais bastante parecidos.

Se levarem em consideração esses resultados, corintianos e vascaínos são os que mais têm motivos para manter as esperanças, já que o sistema costuma acertar suas previsões. Na Copa do Mundo de 2010, a modelagem se mostrou um adversário à altura do polvo Paul, ao prever a eliminação precoce e inédita da dona da casa, a África do Sul, ainda na primeira fase do mundial, e ao ser um dos únicos modelos do mundo a acertar campeão e vice da competição (Espanha e Holanda, respectivamente).

Polvo Paul
Colocado à prova na Copa do Mundo de futebol de 2010, o sistema não ficou devendo nada ao polvo Paul. Acertou a final do torneio e a eliminação da África do Sul na primeira fase. (foto: Álvaro Felipe/ Flickr – CC BY-NC-ND 2.0)

“Também utilizamos o sistema na previsão do campeonato brasileiro de 2010, quando ele apontou o fluminense como campeão.”

O pesquisador destaca a importância da iniciativa para dar visibilidade à estatística. “Essa área da ciência está muito presente em nossas vidas. É importante na previsão do tempo, na medição de audiência de programas de TV e até para avaliar os clientes na hora dos bancos concederem empréstimos”, diz. 

“Aplicá-la a um esporte tão popular como o futebol dá à população a oportunidade de se aproximar da estatística, destaca sua importância em momentos de tomada de decisão e estimula o desenvolvimento e o aprimoramento das metodologias utilizadas hoje.”

 

Marcelo Garcia
Ciência Hoje On-line