13 de desembre del 2016

Si et despistes ets perd un gol (un model estocàstic)

Una de les lectures matemàtiques sorprenents d'aquest 2016 ha estat el llibre de David Sumpter Fútbol y matemáticas (Ed. Ariel). L'autor és un matemàtic anglès que treballa a la Universitat d'Upsala i que dirigeix un grup d'investigació sobre comportament col·lectiu. El que fa interessant el llibre és que s'allunya dels tòpics matemàtico-futbolístics habituals (que també toca, però per sobre) i ens proposa diferents models matemàtics per analitzar altres aspectes com la distribució dels jugadors en el camp, l'estudi dels seus moviments individuals i col·lectius, etc. I, en molts casos, comparant-los amb altres models similars aplicats a la biologia. És difícil adaptar les idees que sorgeixen a l'aula perquè, en molts casos, requereixen l'ús i tractament d'una quantitat ingent de dades. Tot i així algunes sí que poden tenir adaptació com l'anàlisi dels moviments en un petit rondo o el procés d'inici i final d'uns aplaudiments. L'activitat que proposarem a continuació apareix en el primer capítol del llibre "Nunca he predicho nada y nunca lo haré", un divertit i paradoxal títol que té l'origen en una declaració del jugador Paul Gascoigne al 1996.


En aquest capítol Sumpter ens diu. "El que fa que el futbol i altres esports d'equip siguin apassionants és la seva impredictibilitat. Si estàs mirant un partit i apartes la vista durant uns pocs segons, et pots perdre una jugada important i un gol inesperat". Com especialista en models matemàtics ens en proposa un que relaciona clarament estadística i probabilitat.

El vols conèixer?

Seguirem el model proposat al llibre, basat en el futbol anglès, adaptant-o a la lliga espanyola 2015-2016

  • 1r pas: Mitjana de gols per partit
Encara que no ho sembli costa trobar estadístiques sobre la lliga espanyola de futbol que tinguin les dades una mica tractades. En molts casos ens tocarà agafar la calculadora per esbrinar el total de gols marcats al llarg durant la temporada. Una que ens proporciona una taula de resultats, partit a partit i que també necessitarem després, la podeu trobar en aquest enllaç.


El càlcul ens diu que es van marcar 1039 gols.

Ara ens toca saber quants partits es van jugar. També és un problema interessant esbrinar-ho sense comptar els partits un a un. Si ho proposem a classe podem sorgir diferents formes d'argumentar el recompte per a 20 equips. Una pot ser raonar que cada equip s'ha enfrontat a 19 equips a l'anada i als mateixos 19 a la tornada. És a dir, cada equip ha jugat 38 partits. El càlcul 20·38 ens dóna 760 partits, però cada partit s'ha comptat dues vegades (per exemple, una per a l'equip A i l'altre per al B). Així que, en realitat han estat la meitat: 380 partits. El raonament anterior es pot simplificar comptant que cada equip s'enfronta a 19 i que al multiplicar 20·19 = 380 ja tenim el resultat perquè no hem de reduir el doble comptatge. Una solució més geomètrica s'obté de mirar una taula de resultats com l'anterior. Bàsicament és un "quadrat" de 20·20 al que se li ha descomptar la diagonal (un equip no s'enfronta a ell mateix). El càlcul serà 20·20-20 = 400 - 20 = 380.

Bé. Ja  tenim la informació per calcular la mitjana de gols.


  • 2n pas: Recollir la quantitat de gols per partit
La taula que hem mostrat abans ens permet recollir una estadística que ens mostri quants partits han acabat amb zero gols, quants amb un sol gol, quants amb dos, etc, Recollim les dades en el següent gràfic en el que s'observa que la majoria de partits van acabar amb dos o tres gols, i que els partits amb set gols o més són poc freqüents. Encara que en veiem també una raresa: un partit amb 12 gols.


  • Proposem el model
Per "argumentar" que un gol es pot produir en qualsevol moment farem diferents simulacions aleatòries i les compararem al model real. La base de la simulació serà la següent:
  1. assignarem a cada minut una probabilitat de que es produeixi un gol
  2. farem "jugar" partits de 90 minuts on a cada minut es "tirarà un dau" que decidirà, segons la probabilitat assignada, si s'ha marcat gol o no.
  3. Al final del partit comptarem quants gols s'han marcat.
  4. "Jugarem" una lliga de 380 partits i recomptarem la quantitat de gols que s'han marcat a cada partit,
  5. Compararem la simulació amb els resultats reals.
La proposta de Sumpter per assignar una probabilitat a cada minut és utilitzar la de de la temporada real, dividint la mitjana de gols per partit entre 90 minuts.


  • Fabriquem un simulador
El nostre "dau" pot ser obtenir un número aleatori amb la calculadora i assignar gol si el resultat obtingut és, arrodonint, igual o inferior a 0,0304. Però simular-ho de forma real a classe és  massa llarg: 380 partits de 90 minuts són 34200 tirades. Convé fer ús de la programació o del full de càlcul.

Amb Scratch es pot fer un simulador que ens pot ser útil. Aquí tenim un que ens juga tota una lliga, encara que a l'aula es pot fer un més senzill que faci un sol partit o una jornada de 10 partits. En aquesta simulació cada vegada que cliquis sobre la bandera verda produirà una lliga nova completa.


Una altra possibilitat és preparar un full de càlcul que "jugui" en 380 files partits de 90 minuts (un per columna). L'avantatge és que ens pot fer el recompte i generar el gràfic automàticament. En aquest enllaç us en podeu descarregar un de prova. Cada vegada que pitgem la tecla F9 fa una nova simulació. A la següent imatge podeu veure el resultat de 10 simulacions diferents. En aquestes simulacions les barres representen els resultats reals de la lliga 2015/16 i la línia vermella els resultats obtinguts per les simulacions. Com es pot veure la forma i alçada de la curva és força semblant.


Podem dir que el model proposat al llibre Fútbol y matemàticas funciona prou bé. La realitat i el model aleatori es corresponen força: un gol es por produir en qualsevol moment  hem d'estar atents.

Potser podem criticar que, al cap i la fi, la simulació aleatòria es basa en dades d'una temporada real i que, per tant, és lògic que s'ajustin. Encara que la crítica tingui base podem dir, en la seva defensa, dues virtuts: ens suggereix una bona activitat d'aula que relaciona estadística i probabilitat i la hipòtesi inicial se'ns confirma mirant l'experiència personal: quantes vegades us heu perdut un gol per no mirar "en aquell moment"?


  • Apliquem el model a un altre esport
El propi Sumpter fa "la prova del cotó" al seu model mirant partits de hoquei gel. Nosaltres l'aplicarem al futbol sala, un esport en el que la variabilitat en la quantitat de gols per partit és més gran que en el futbol de camp gran. En aquest cas ens basarem en el Campionat Mundial de Futbol Sala de  FIFA fet a Colòmbia al 2016. Podem consultar els resultats a la Viquipèdia. També en aquest cas us podeu descarregar un full de càlcul per realitzar les simulacions. Al Campionat Mundial la quantitat de partits  és menor (52) i també ho és la durada del partit (40 minuts) el que fa que s'acosti millor a les possibilitats d'una simulació realitzable a classe "manualment". Com podreu veure als 10 gràfics d'exemple generats l'ajustament ara no és tan bo com abans, però, globalment, tampoc està tan lluny de la realitat.


  • I a l'aula?
Les pistes de transposició a l'aula de l'activitat han estat donades en la seva pròpia explicació: recollir, tractar i representar dades, fer simulacions reals o dissenyar generadors de simulacions (més senzills o més sofisticats), provar el model amb altres esports tot cercat les dades necessàries, discutir sobre la bondat del model i si respon prou bé la pregunta o no... i estudiar la possibilitat de portar a l'aula altres exemples de modelització presentats al llibre.

Cap comentari:

Publica un comentari a l'entrada