door: Frank Blaauw & Ruud den Hartigh
Data-science en big data nemen de wereld over. Van de medische wereld tot aan het ontwikkelen van de perfecte kunstmatige intelligentie, overal wordt data gebruikt, en het liefst zo veel mogelijk. De sportwereld loopt hierop niet achter en er worden talloze data verzameld op allerlei verschillende manieren. Binnen vrijwel alle sporten worden statistieken bijgehouden over winst, verlies, eindtijden, gewonnen punten, enzovoorts. Daarnaast worden er tijdens wedstrijden en trainingen gegevens verzameld over bewegingspatronen, hartslag en soms ook psychologische ervaringen. Via dit soort metingen kunnen we veel te weten komen over de prestaties van de sporter. En nog belangrijker: hoe deze prestaties verbeterd kunnen worden.
Datawetenschappers kunnen geavanceerde, slimme analyses uitvoeren op grote hoeveelheden data. Op die manier kunnen er interessante patronen gevonden worden die de wetenschap, de sporter en de coach verder kunnen helpen. Toch betekent dat niet dat de datawetenschapper ons nu kan gaan vertellen hoe sportprestaties verbeterd kunnen worden.
De data-science kan pas echt iets voor de sport betekenen als de data omgezet kan worden naar relevante informatie
Verbinding
Het is juist de samenwerking tussen de wetenschap en de sport die ons verder kan helpen. Want hoewel data-science en big data samen een nuttige toevoeging zijn om nieuwe inzichten te genereren, kunnen deze inzichten ook volkomen nutteloze informatie opleveren. Dit is met name het geval wanneer de verbinding tussen sport en wetenschap ontbreekt.
Een illustratief voorbeeld hiervan is een recent onderzoek onder professionele tennissers (Cui, Goméz, Gonçalvez, & Sampaio, 2017). Uit dit onderzoek bleek onder andere dat linkshandige spelers (zoals Rafael Nadal) op Roland Garros beter presteren met een tweede service op links dan rechtshandige spelers. Een interessant weetje, maar de sporter, coach en wetenschapper zullen er niets mee kunnen. Als we uitsluitend op de data-analyse afgaan, zal de praktische aanbeveling zijn dat tennissers vanaf links het beste hun tweede service met links kunnen serveren. De analyse levert daarmee irrelevante informatie op. Geen coach zal zijn of haar rechtshandige pupil vragen om met links te gaan serveren.
De data-science kan dus pas echt iets voor de sport betekenen als de data omgezet kan worden naar relevante informatie. Daarom is het belangrijk dat de uitvoering van data-science en data-analytics inherent verbonden is aan de praktijk. Concreet kan de data-science het meest voor de sport betekenen als datawetenschapper, sportwetenschapper en de praktijk (bijvoorbeeld de coach) met elkaar samenwerken. Vanuit de praktijk kan data aangeleverd worden, in overleg met de sportwetenschapper kan bepaald worden welk type data geanalyseerd moet worden en in overleg met de datawetenschapper kan bepaald worden welke informatie er uit de data gehaald moet worden. Deze drie elementen zullen we hieronder kort toelichten.
Overleg tussen wetenschap en praktijk
De wetenschap kan de praktijk van nieuwe inzichten voorzien. Hierbij blijft het belangrijk dat er overleg blijft plaatsvinden tussen de wetenschap en de praktijk om het praktisch nut van deze inzichten te waarborgen. Een voetbalclub kan grote hoeveelheden data hebben over spelers. Denk hierbij aan psychologische data (motivatie, vertrouwen, etc.), positiedata op het veld, hartslagdata, zelfrapportage van fysieke belasting en herstel. Tegelijkertijd kan de club alleen geïnteresseerd zijn in de belasting en belastbaarheid van spelers waardoor wetenschappers gericht kunnen kijken naar patronen in hartslag-, belasting- en hersteldata. Daarmee kunnen ze de betekenisloze data omzetten naar voor de club relevante informatie.
Door data uit verschillende invalshoeken te combineren kan er een goed beeld geschetst worden van het individu
Kennis uit grote hoeveelheden data
Data-science is een fantastische tool om informatie te vergaren uit grote hoeveelheden data. Door data uit verschillende invalshoeken te combineren kan er een goed beeld geschetst worden van het individu. Zo kunnen bijvoorbeeld fysiologische en psychologische data verzameld worden bij schaatsers. Vervolgens kunnen de fysiologische en psychologische variabelen gecombineerd worden om in kaart te brengen wanneer een sporter in een toestand verkeert waarin hij/zij optimaal presteert (of juist niet).
Automatische analyses
Grote gedeelten van data-science kunnen, als ze eenmaal opgezet zijn, automatische analyses uitvoeren op inkomende data. Om dit in de praktijk te brengen zouden open data-platforms de samenwerking tussen verschillende partijen kunnen verbeteren. Zo kan bijvoorbeeld data van een schaatswedstrijd automatisch verzameld worden, omgezet worden naar een afgesproken format en in een algoritme gegoten worden om nieuwe informatie te genereren. Denk bijvoorbeeld aan een voorspelling van een eindtijd of aan het meest optimale schema dat gereden kan worden voor een podiumplaats.
Kortom, data-science is een krachtige en handige tool voor het vergaren van nieuwe inzichten in de sport, maar alleen handig wanneer er op een goede manier gebruik van wordt gemaakt en wanneer de praktijk niet uit het oog verloren wordt.
Dr. Frank Blaauw is een Postdoc onderzoeker bij de Rijksuniversiteit Groningen. Hij werkt daar als computerwetenschapper bij de distributed systems group van het Bernoulli Institute for Mathematics, Computer Science and Artificial Intelligence en bij de group ontwikkelingspsychologie bij het Heymans Institute for Psychological Research. Zijn onderzoek richt zich voornamelijk op machine learning, time series analysis en distributed computing.
Dr. Ruud den Hartigh is universitair docent Talentontwikkeling en Creativiteit aan de Rijksuniversiteit Groningen. Binnen de afdeling Psychologie is hij de coördinator van het masterprogramma Talent Development and Creativity. Zijn onderzoek richt zich met name op momentum in sport en de selectie en ontwikkeling van talent.