"The consumer is out of control" – Roskilde Festival Big Data Hackaton

Gennem flere år har vi i it-branchen talt så meget om big data, at det skygger for, at de fleste virksomheder stadig er temmelig usikre på fænomenet.

Roskilde Festival

Men Roskilde Festival Big Data Hackaton er i den grad undtagelsen, der bekræfter reglen, for i skrivende stund trækker projektet utallige gigabytes data ud af bl.a. den app, som over 70.000 af de 130.000 gæster på festivalen har liggende på deres smartphone.

Roskilde Festival er rent faktisk Danmarks fjerdestørste by i den korte periode, festivalen varer, og kan ses som en lille civilisation, og appen samler hele tiden – anonyme! – data fra telefonernes GPS, ligesom man også kobler information fra Spotify, sociale medier og mange andre kilder.

Det gør big data til en utroligt konkret størrelse, når forskere, studerende og ansatte fra bl.a. IBM, CBS og virksomheder som Meyers bliver i stand til at koble, anskue og drage konklusioner fra alle de mange, mange informationer.

Jeg var selv ude at høre nøglekonklusionerne fra årets udgave af årets Roskilde Festival Big Data Hackaton forleden. Og kort fortalt er big data helt basalt med til at gøre festivalen mere velfungerende og sikker, samtidig med at man har optimeret kundeoplevelsen og reduceret spild. Det er utroligt spændende.

”The consumer is out of control”
Som en oplægsholder sagde det: ”The consumer is out of control!” Og det gør big data og dataanalyse særdeles relevant, når smagen hos både festivalgæster (og forbrugere i almindelighed!) skifter så hurtigt, at man ikke længere blot kan basere sig på fornemmelser og erfaring.

Eksempelvis har analyserne af gæsternes faktiske adfærd vist, at op mod ti procent af alle festivaldeltagerne aldrig kommer ind at høre koncerterne. Dermed når de heller ikke forbi de områder, hvor mange af madboderne og eventområderne er.

Og hvor man skulle tro, at flertallet af festivaldeltagere hænger ud samme sted i længere perioder – fx til koncerter – har analysen vist, at langt de fleste faktisk bevæger sig rundt næsten konstant og kun bliver samme sted i kortere perioder ad gangen.

Roskilde Festival Big Data Hackaton har kort sagt bragt data i spil for at skaffe ekstremt nyttig viden og indsigt til torvs, og med det formål in mente har projektet de seneste år vekslet mellem tre faser:

What happened? Hvilke koncerter og events samlede flest mennesker? Hvornår solgte man fleste øl og sandwich? Og så videre …

What is happening? Hvad sker på pladsen lige nu? Hvor bevæger folk sig hen?

What will happen? Hvordan kan vi bruge eksisterende viden til at forudsige, hvad der sker om lidt? Hvilke koncerter vil tiltrække flest gæster? Hvordan vil vejret påvirke dette års festival i forhold til de tidligere år?

I dag er projektet så langt, at festivalens sikkerhedsansvarlige på et interaktivt kort kan se, hvordan menneskemængder forsamles og bevæger sig på området.

Hvis der fx opstår et stort pres på den centrale gangbro over til Rising Star-scenen, kan ledelsen med det samme dirigere ekstra sikkerhedsfolk derhen for at styre menneskemængderne, så ingen kommer til skade.

Data sikrer brød til flæskestegssandwichen
Man er med andre ord meget langt inde i ”What is happening?”-fasen og har også taget godt hul på næste fase, hvor modeller og data giver indsigt i ellers skjulte sammenhænge.

Projektet har allerede affødt en række modeller, der kombinerer geospatiale data/GPS-data med eksempelvis data fra Spotify og sociale medier til at planlægge koncerter mere optimalt. Blandt andet så man undgår at booke en kunstner på en alt for lille scene – og først undervejs i koncerten blive overrasket over kæmpestore menneskemængder, fordi kunstneren er langt, langt mere populær end ventet.

Ligeledes undgår man at booke to bands med overlappende fanskare, så de ikke spiller samtidig. Mulighederne er uendelige.

Men virksomhederne kan også være med. Eksempelvis når man kobler viden om salget af flæskestegssandwich hos Meyers – der immervæk sælger op mod 2.000 sandwich i timen! – med viden om, hvornår salget peaker i forhold til afslutningen af de koncerter, hvor der er flest gæster med præference for Meyers – det kan man nemlig også regne sig frem til!

Det tager Meyers tre timer at bage brødet, så indsigt om den sandsynlige fremtidige efterspørgsel er ekstremt værdifuld viden, der både øger kundetilfredshed og indtjening.

Visuelle data giver praktisk indsigt
Det er anvendelig indsigt og praktisk dataanvendelse på et niveau, der gør projekter som det her utroligt interessante for en it-professionel som mig. Ganske enkelt fordi Roskilde-projektet gør alt det, vi i it-industrien har talt om i årevis – og fordi projektet gør det meget konkret.

Noget af det, jeg især blev imponeret over, er, hvor stor vægt projektet har lagt på at gøre output visuelt i form af dashboards, som er meget intuitive at aflæse. Det er godt tænkt, for de færreste af os er særlig gode til at forholde os til tal og procenter. Derimod kan vi alle forholde os til en graf eller et kort, der med røde, blå og grønne nuancer viser, præcis hvor mange mennesker der hører Phlake, Lorde eller The Weeknd nu.

Men undervejs har man også gjort sig en række værdifulde erfaringer om, at man skal være opmærksom på at give brugeren tilstrækkelig meget værdi og funktionalitet tilbage mod adgang til fx GPS-data. Det er egentlig ikke et nyt fænomen, men noget eksempelvis Google og andre gratis brugertjenester har gjort brug af i mange år og en vigtig forudsætning for at kunne høste brugbare data og give brugeren en god serviceoplevelse retur.

Og selvfølgelig skal lovgivningen overholdes hele vejen igennem, så data fx indsamles 100 % anonymt.

Prøv ideer af, vær klar til at fejle – og få ny indsigt
En anden læring af projektet er, at man ikke altid fra start ved, hvad man får ud af det, når man kobler big data og fx machine learning. Ofte opnår man nyttig indsigt og finder skjulte sammenhænge, man aldrig ville have en chance for at finde tidligere, ved at afprøve forskellige hypoteser. Andre gange finder man intet som helst. Og det skal man være klar til – bare man lærer hurtigt og kommer videre med nye hypoteser i en fart. Fuldstændig ligesom hackaton-teamet på Roskilde Festival har gjort de seneste år med stor succes.

På den anden side er det efterhånden så relativt enkelt og overkommeligt at afprøve hypoteser med kognitive cloudbaserede platforme som fx IBM's Watson, at det – modsat tidligere – absolut er inden for rækkevidden af selv små og mellemstore organisationer uden enorme budgetter. Jeg ser fx selv frem til at se, hvordan IBM's Bluemix Garage-initiativ i København kan hjælpe kunder med værdifuld indsigt og innovative løsninger.

Så det er egentlig bare at komme i gang, for gevinsten er potentielt enorm – uanset om du vil vide mere om dine kunders præferencer, vaner og indkøbsmønstre, eller hvornår der skal 10 ekstra vagter ud til Camping West i en hulens fart!

Annonce
Relateret
Trendspotting

Elnetselskaber på trend-spotting i Glasgow

Af: Jørgen S. Christensen

Microservice1 - Katrine Dyreborg Strauch

Hvad er fordelene ved microservices?

Af: Kenneth Lange

Dataetik - Foto charlz-gutierrez-de-pineres

Apples dataetiske forretningspraksis- og kultur

Af: Gry Hasselbalch og Pernille Tranberg

Annonce