
Big data vokser og vokser. Foto: Getty
Big data kan defineres på mange måder, og næsten alle har en holdning til, hvad big data er. Her er fire retningslinjer, som måske kan hjælpe dig med at forstå, hvad big data er.
Big data vokser og vokser. Foto: Getty
Anders læser International virksomhedskommunikation med speciale i organisation og ledelse på Aalborg Universitet.
Kontakt og følg Anders Fabricius Sørensen
Når mængden af data gør, at de traditionelle måder at indsamle og behandle data på ikke længere er tilstrækkelige, er der som tommelfingerregel tale om big data.
Ifølge Angelo Alonso, Machine Learning Engineer hos Tradeshift, kan et eksempel på big data være, når værdierne ikke længere er numeriske, eller når antallet af forespørgsler overstiger et vist niveau.
Når man snakker om big data, taler man også om bytes, og her har udviklingen skubbet kraftigt til opfattelsen og forståelsen af big data.
For 10 år siden talte man fx om, at datasæt af en vis gigabyte-størrelse var store. Men nu er datasæt på både petabyte og exabyte ikke usædvanlige. Big data er for alvor nået op i en størrelse, hvor det kan være svært at overskue og forstå det reelle omfang af data. Fx flyttede Microsoft 150 petabytes, da de flyttede al den eksisterende data i Hotmail til Outlook. For at sætte dette tal i relief er en petabyte 1015 byte = 1 000 000 000 000 000 bytes!
Overordnet set kan man pege på fire karakteristika for Big Data: High volume, High veracity, High variety og High variability.
Forskellen mellem High variety og High variability kan illustreres som et besøg hos en bager, der sælger 10 forskellige slags brød. Det er variety. Forstil dig nu, at du går til den samme bager tre dage i træk og køber det samme brød. Selv om det er samme slags brød, vil det hver dag smage og dufte en smule anderledes, fordi der vil være små ændringer i din opfattelse af brødet og den situation, du spiser det i. Det er variability.
Hvis få gode data er godt, må big data være rigtig godt. I teorien er de fleste da også enige om, at evnen til at databehandle store mængder data giver os enorme muligheder.
Ifølge Magasinet Finans kan big data fx bruges til en række lavpraktiske formål som:
Den danske erhvervsstyrelse satte da også i 2013 spotlight på big data i rapporten "Big data som vækstfaktor i dansk erhvervsliv – potentialer, barrierer og erhvervspolitiske konsekvenser". I rapportens indledning hedder det:
"Flere internationale analyser har estimeret store potentialer i big data og fastslået, at big data baserede virksomheder klarer sig bedre end andre virksomheder. Derfor er det også vigtigt, at erhvervspolitikken forholder sig til udviklingen, og at der tages stilling til, hvad der eventuelt kan gøres for at fremme udbredelsen af big data i Danmark."
Offentlige og private danske virksomheder samler da også flere data ind om virksomhed, drift, borger og kunder end nogensinde før. Alligevel halter vi efter nabolandene i arbejdet med at anvende data systematisk.
For at gøre opmærksom på vækstmulighederne i de gemte og glemte data er Dansk Industri, CBS, Alexandra Instituttet og en række it-virksomheder som IBM og EG gået sammen i projektpartnerskabet "DataForBusiness". Projektet går blandt andet ud på at stille virksomhederne en række spørgsmål om dataanvendelse.
Besvarelserne lægges ind i et værktøj, som giver virksomhederne indsigt i eget datapotentiale, benchmarker mere end 500 deltagervirksomheder anonymt mod hinanden og giver nem adgang til handleplaner og rådgivere, der hjælper med næste trin.
Mens forskerne, it-virksomhederne og ikke mindst de offentlige og private virksomhedsejere på den måde forsøger at indkredse og udnytte fænomenet big data, vokser datamængden sekund for sekund.
Hvert andet år fordobles den samlede mængde af data, og ifølge it-giganten EMC vil det digitale univers i 2020 være ti gange større end i dag, skrev Berlingske i 2014.
Af rapporten fremgik det, at en gennemsnitlig husstand hvert år genererer data, der svarer til at fylde 65 iPhones med 32 gigabyte. Det vil i 2020 være 318 iPhones.
Samtidig vurderede Cisco i 2016, at verdens samlede datamængde ville være 6,2 zettabytes i 2020.
Størstedelen (84 %) vil være opbevaret på enheder som pc'er og tablets, mens 16 % vil blive opbevaret i datacentre som fx Dropbox.
Tilmeld dig vores nyheder fra DXC Technology, og få strategisk inspiration og konkrete forslag til, hvordan din virksomhed bedst udnytter de digitale muligheder - direkte i din indbakke.
Hos DXC har vi spændende tilbud og nyheder om vores produkter, løsninger og tjenester, som vi vil orientere dig om via e-mail. Vi bruger dine oplysninger til at forudsige, hvad du måske er interesseret i. Vi behandler dine data med respekt, og du kan læse om vores databehandling på vores side om privatlivspolitik.
Når du giver tilsagn om DXC databehandling, giver du samtidig DXC muligheden for at markedsføre skræddersyet indhold til dig. Databehandling giver DXC mulighed for at anvende dine oplysninger til at levere det mest relevante indhold og oplevelser på websites. Denne tilladelse kan trækkes tilbage når som helst. For flere oplysninger om, hvordan information bruges, se DXC's privatlivspolitik.