door: Otto Koppius
Er komen steeds meer systemen op de markt, variërend van wearables tot dieptecamera’s, die het mogelijk maken om op een laagdrempelige manier 3D data van sporters te verzamelen. Dan loop je als coach en atleet echter wel het risico om te verdrinken in de data, maar er zijn ook steeds meer tools en richtlijnen om toch zinvolle analyses te kunnen doen.
Een jaar geleden schreef ik een column over 'Locatie, locatie, locatie: nieuwe ontwikkelingen om veldtactiek meetbaar te maken met data'i naar aanleiding van een hele interessante presentatie van een team onderzoekers van FC Barcelona tijdens de MIT Sloan Sports Analytics Conference in Boston. Vorige maand was de 2019-editie van deze conferentie en hoewel er ook daar weer veel onderzoek werd gepresenteerd over locatiedata, was er ook een fascinerende presentatie van het bedrijf STATS uit Chicago over de volgende stap in tracking-dataii: 3D data. Locatiedata, ofwel de x, y-coördinaten van een speler op het veld, zijn namelijk heel inzichtelijk, maar hebben toch ook zijn beperkingen. Zie bijvoorbeeld een illustratie in figuur 1 aan de hand van drie opeenvolgende momenten binnen een basketbalwedstrijd:
Figuur 1 Locatie-analyse van schot door speler 3. Bron: Felsen & Lucey (2017)
Televisiebeelden erbij pakken
Wanneer je puur op de locatie-analyse zou afgaan, lijkt het alsof speler 3 niet slim bezig is: hij heeft de bal op de rand van de driepuntlijn, staat vrij, maar wacht totdat speler 23 van de tegenstander voor hem staat om te schieten. Echter, wanneer je de televisiebeelden erbij pakt, wordt duidelijk wat er gebeurde: speler 3 kreeg een slechte pass, moest bukken om te bal onder controle te krijgen en gaf daardoor de tegenstander (speler 23) genoeg tijd om erbij te komen en hem te dekken. Zie figuur 2, waarin figuur 1 gekoppeld is aan de bijbehorende beelden.
Wanneer je puur op basis van locatie-data werkt, loop je het risico van verkeerde conclusies
Figuur 2: Analyse van schot door speler 3, nu met camerabeelden en lichaamshouding erbij. Bron: Felsen & Lucey (2017)
Wanneer je puur op basis van locatie-data werkt, loop je hiermee natuurlijk het risico van verkeerde conclusies door dit soort onnauwkeurigheden (het is wachten op de eerste speler die een club aanklaagt omdat hij niet opgesteld wordt op basis van aantoonbaar onnauwkeurige analyses!). En zeker wanneer dit soort situaties vaker voorkomt, komt dat het vertrouwen in data-analyses in de sport niet ten goede. Gelukkig biedt figuur 2 ook een veelbelovende oplossingsroute: skelet-data om de lichaamshouding van de diverse lichaamsdelen te bepalen. Uit de skelet-data is duidelijk af te leiden dat speler in het eerste plaatje duidelijk niet in een houding staat om te kunnen schieten en dat dus de pass niet goed aangekomen is.
Laagdrempelige ‘slimme kleding’
Dit soort skelet-data was vroeger voorbehouden aan gespecialiseerde onderzoekslabs of mensen die zich dure ‘motion-capture’-pakken konden veroorloven. De laatste jaren is het verkrijgen van dit soort data in de dagelijkse praktijk al wat toegankelijker geworden door laagdrempelige ‘slimme kleding’ of makkelijk verplaatsbare camera-systemeniii. Het team van STATS liet in Boston echter zien dat het recent door onderzoekers van Carnegie Mellon University ontwikkelde OpenPoseiv algoritme nu ook gebruikt kan worden om dit soort data af te leiden uit normale televisiebeelden.
De potentiële toepassingen van dit soort data zijn legio: een golfswing of een service bij tennis kan zo prima gemodelleerd worden
OpenPose is een deep learning-algoritme dat automatisch romp, armen, benen, handen, voeten en hoofd herkennen op basis van standaard camerabeelden, maar dan ook echt in real-time (veel eerdere algoritmes konden dit alleen achteraf na flink wat rekentijd) en ook wanneer er meerdere personen in beeld zijn en bewegen. De volgende twee video’tjes, één van drie jonge ijshockeyers op snelheid en één van een vrije trap bij voetbal in slow-motion, geven een aardig beeld van wat OpenPose kan:
De potentiële toepassingen van dit soort data zijn legio: een golfswing of een service bij tennis kan zo prima gemodelleerd worden, bij roeien kan duidelijk geanalyseerd worden of alle roeiers in de boot parallel door de boot bewegen, bij voetbal kan gekeken worden hoe een kopduel effectief uitgevoerd kan worden.
Risico's
Toch zitten er wel risico’s aan dit soort systemen als OpenPose, waarvan een van de belangrijkste is dat meer data niet altijd beter is: dit soort skelet-modellen (of andere modellen op basis van 2D-/3D-data) blijven modellen. Hoe gedetailleerd de onderliggende data ook mag zijn, modellen zijn per definitie een abstractie van de werkelijkheid en een goed model is een nuttige abstractie. Dat betekent dat een van de grootste kunsten van een goed model is om de juiste balans te vinden tussen datgene wat in weinig detail gemodelleerd kan worden en datgene wat in veel detail gemodelleerd moet worden.
In het eerder gegeven voorbeeld van de driepunter bij basketbal is bijvoorbeeld het nauwkeurig modelleren van de stand van de armen en polsen cruciaal, maar voor het onderlichaam is een stuk minder nauwkeurigheid vereist. Hoewel een dergelijke richtlijn natuurlijk in principe voor elk model geldt, wordt het belang van deze richtlijn wel een stuk groter in het geval van grote 3D-datasets waarbij het risico van ‘door de bomen het bos niet meer zien’ ook een stuk groter is.
Dit illustreert wat de extra rijkdom van 3D-data kan zijn
Een andere richtlijnv die enigszins in het verlengde van de vorige richtlijn ligt, is om niet alleen volledige 3D-modellen te maken, maar juist ook een aantal bewust versimpelde modellen op basis van 2D- of zelfs 1D-data en die te vergelijken. Als we weer teruggaan naar het driepunter-voorbeeld in basketbal, dan zou je het succes ervan in eerste instantie kunnen proberen te voorspellen met een heel simpel model, puur aan de hand van het lengteverschil tussen de schutter en de verdediger (een 1D-model).
Extra rijkdom
Een iets geavanceerder 2D-model zou op basis van locatie-data ook de afstand tussen schutter en verdediger als extra variabele kunnen gebruiken (cf. figuur 1). Een eerste 3D-model zou de houding van de armen van de verdediger mee kunnen nemen en een nog wat geavanceerder 3D-model zou ook bijvoorbeeld de hoeken van de elleboog en pols van de aanvaller mee kunnen nemen. Een nog geavanceerder model zou ook nog rekening kunnen houden met het blikveld van de spelers (kijkt de verdediger naar de bal of naar de man?). Echter, omdat dit niet een simpele afstandsformule of hoekmeting is, zijn hier weer aparte algoritmes nodig om te berekenen, maar dit illustreert wel wat de extra rijkdom van 3D-data kan zijn.
Met een dergelijke modelopbouw in meerdere stappen kan de toegevoegde waarde van elke extra data-dimensie goed geïsoleerd worden, wat handig kan zijn voor coaches en atleten om te weten welke factoren meer of minder van belang zijn. Dat blijft wel de Achilleshiel van dergelijke modellen en systemen: hoe geavanceerd de data en de statistiek ook mag zijn, als het niet op een gebruikersvriendelijke en inzichtelijke manier leidt tot nuttige kennis, dan blijft het alleen maar goed voor een paar leuke video’s en de bijbehorende wow-factor.
Speld uit hooiberg
Met de stortvloed aan data in de sport, groeit de behoefte aan geautomatiseerde systemen die coaches en atleten kunnen ondersteunen om niet alleen de juiste speld uit de hooiberg te halen, maar ook om überhaupt de juiste hooiberg te vinden. Naarmate we meer met 3D-data gaan werken, nog betere richtlijnen voor de analyse kunnen geven en systemen als OpenPose en BallJames zich verder ontwikkelen, komen we steeds een stap verder. We zijn er nog zeker niet, maar de ontwikkelingen gaan snel. Ik kijk nu al uit naar wat de MIT Sloan Sports Analytics Conference in 2020 brengt!
Noten:
i 'Locatie, locatie, locatie: nieuwe ontwikkelingen om veldtactiek meetbaar te maken met data', column op Sport Knowhow XL 24 april 2018
ii Helaas laat deze video alleen de spreker zien en niet de slides en de video's die de spreker liet zien. Ze bouwden hierbij voort op hun eerdere onderzoek uit 2017, waarin ze onderzochten wat de invloed was van lichaamshouding op het succes van driepunters in basketbal
iii Zie bijvoorbeeld de diverse toepassingen in de portfolio van Kinetic Analysis
iv Het algoritme is open source gemaakt. De wetenschappelijke onderbouwing van het algoritme is hier te vinden
v Deze richtlijnen, plus nog enkele andere die hier niet behandeld worden, zijn tot stand gekomen in een project met Tobias Brandt (Rotterdam School of Management) en Gunther Gust, Markus Rosenfelder en Dirk Neumann (allen van de Universiteit van Freiburg).
Otto Koppius is universitair docent Business Analytics op de Rotterdam School of Management, Erasmus Universiteit. Hij doet vooral onderzoek naar toepassingen van nieuwe databronnen zoals wearables en nieuwe analysemethoden om vraagstukken rondom talentmanagement, coördinatie in teams en de fysieke en mentale fitheid van atleten en werknemers te bestuderen. Naast zijn universitaire werk is hij roeicoach en heeft hij meerdere ploegen naar wereldkampioenschappen en andere grote toernooien begeleid. Voor meer informatie: okoppius@rsm.nl.