- De vraag van… Sanne de Vries, lector 'Gezonde Leefstijl in een Stimulerende Omgeving' aan De Haagse Hogeschool
- Aan... Joost Kok, hoogleraar Fundamentele Informatica aan de faculteit der Wiskunde en Natuurwetenschappen van de Universiteit Twente, hoogleraar Geneeskunde aan de Universiteit Leiden, initiatiefnemer en directeur van het Leiden Centre of Data Science en van het Sport Data Center en per 1 februari 2018 decaan van de faculteit Elektrotechniek, Wiskunde en Informatica van de Universiteit Twente
De vraag
Hoe kun je big data uit de sport- en beweegpraktijk analyseren en gebruiken voor verbeteringen van bijvoorbeeld tactiek, materiaal of om mensen aan het bewegen te krijgen?
Het antwoord
Door te leren uit data krijg je een extra paar ogen waarmee je met een frisse blik naar bestaande situaties kunt kijken. Het is ook relatief goedkoop, de computer doet het meeste werk. Het is belangrijk om echt goede data in handen te hebben. Goed in de zin van netjes gemeten volgens standaarden. En ook netjes gelabeld, het liefst met termen uit geaccepteerde ontologieën. Want om wat met data te kunnen doen moet de computer aan het werk gezet worden en de labels (de metadata) helpen de computer, ze geven context. Zo kan de computer redeneren of twee dataverzamelingen met elkaar gecombineerd kunnen worden door te kijken of een label een bijzonder geval van een ander label is.
"Met veel data ter beschikking kun je zeggen: persoon x adviseer ik de training lichter te maken omdat uit de historische data blijkt dat doorgaan op hetzelfde niveau vaak leidt tot blessures"
In grote hoeveelheden data kun je op zoek gaan naar vergelijkbare situaties. Het is dan mogelijk om modellen te maken die kijken wat in vergelijkbare situaties werkte of niet werkte. Zo krijg je adviezen gebaseerd op de al beschikbare data: 'vergelijkbare mensen die op een soortgelijke manier trainden, kregen in x procent van de gevallen een blessure'. Met veel data ter beschikking kun je dan zeggen: persoon x adviseer ik de training lichter te maken omdat uit de historische data blijkt dat doorgaan op hetzelfde niveau vaak leidt tot blessures.
Sport engineering
De afgelopen zomer hebben we goede ervaringen opgedaan met een dergelijke aanpak op een database van meer dan twee miljoen lopers die naast de loopjes ook veel extra informatie bevat, zoals het gebruikte schoeisel. Je kunt dan wel iets zeggen over het materiaal maar ik verwacht op dat gebied meer van een 'klassiekere' sport engineering-aanpak.
Zijn er genoeg voorbeelden met uitkomsten, dan kun je kijken of je met de computer de uitkomsten kunt voorspellen. Dit is bijvoorbeeld de basis om trainingsschema’s te relateren aan de resultaten van de wedstrijd direct erna. Je kunt dan zien wat werkt en wat niet.
"We zijn al een heel eind op weg, maar er is nog veel onderzoek nodig voor we de gamechanger realiseren"
In de route Sport en Bewegen van de Nationale Wetenschapsagenda is de gamechanger 'Bewegen op maat, voor iedereen, in elke leeftijdsfase: het kan!'. Begeleid sporten is een manier om bewegen op maat te realiseren en de doelen zijn meestal duidelijk: zoals geen blessure krijgen, een marathon lopen of voldoen aan een gezond-leven-norm. Continu advies is hier de sleutel maar continu advies door een trainer is duur. En zelfs als de motivatie aanwezig is, wil dat nog niet zeggen dat de doelen gehaald worden! De grote vraag is of dit soort persoonlijke adviezen uit data gegenereerd kunnen worden waarbij om incidenten heen gepland wordt (zoals een TomTom om files heen plant). We zijn al een heel eind op weg, maar er is nog veel onderzoek nodig voor we de gamechanger realiseren.
Verzameling bewegende puntjes
Ook aan hele teams is het mogelijk om advies te geven op grond van data. Een manier is om een wedstrijd te zien als een verzameling bewegende puntjes. Uit dat soort data kun je leren wat de kans is op specifieke spelsituaties binnen een vooraf gegeven tijd, zoals de bal in het strafschopgebied of een schot op doel. Dat is natuurlijk erg interessant voor de tactiek. Je kunt dan interactief kijken hoe de kans verandert als een speler wat harder loopt en/of op een iets andere positie staat.
We zijn hard bezig om in Nederland de datazaken rond sport en bewegen goed te regelen. Nederland is een relatief neutraal land dat een uitstekende uitgangspositie heeft om een topspeler op dit gebied te worden. We hebben een goed georganiseerde sportsector, we hebben in Nederland bedrijven als Virtuagym, MyLaps, Gracenote/Infostrada en Scisports die wereldspelers zijn op sportdatagebied en we hebben ook nog topdatawetenschappers.
"Met data kun je heel veel en waarschijnlijk meer dan de meeste sportwetenschappers denken"
Sport Data Valley
Vanuit Sportinnovator (topteam Sport) is de Sport Data Valley (SDV) opgezet, die nu echt goed op gang begint te komen. De SDV is de nationale onderzoeks- en innovatie-infrastructuur rond sportdata die gebouwd wordt op bestaande infrastructuur. De SDV is gedistribueerd waarbij de data en methoden zoveel mogelijk bij de eigenaren blijven en hij is breder dan alleen data: ook methoden, mensen en laboratoria zijn er onderdeel van. De SDV verbindt het Sportinnovator ecosysteem waar ook ons eigen Sport Data Center (SDC) deel van uitmaakt. De missie van het SDC is extra waarde toevoegen aan sportdata en het centrum is een samenwerking tussen Amsterdam, Leiden en Delft.
Met data kun je heel veel en waarschijnlijk meer dan de meeste sportwetenschappers denken. Het is wel essentieel om sportdomeinkennis te combineren met de datawetenschap. En wat niet in de data zit kun je er ook niet uithalen!
Volgende keer het antwoord op de vraag van Joost Kok aan Daan Bregman, werkzaam bij TU Delft Sports Engineering Institute:
Beste Daan,
Jij werkt mee aan een groot onderzoeksprogramma om sportblessures te voorkomen met behulp van technologie. Kun je daar wat meer over vertellen? En wat is jouw inschatting: welk percentage van alle sportblessures kun je voorkomen met behulp van technologie?