Big Data?

Date: Category: Business Intelligence

Ongeacht de grootte van je bedrijf is de kans groot dat je van de term ‘big data’ hebt gehoord. Het is een term waar je bijna net zo vaak mee om de oren wordt gegooid als het woord ‘cloud’. Maar wat is big data eigenlijk? En wat kun je ermee? Net als bij menig ander modewoord, en zoals vaker bij nieuwe ontwikkelingen, is er  onduidelijkheid over de definitie en wordt het vaak nog op verschillende manieren geïnterpreteerd. Ook wordt de term veelvuldig ten onrechte gebruikt. Voordat we dus meer over big data gaan vertellen zullen we eerst definiëren wat we bedoelen als we over big data praten en waar het vandaan komt.

Wat is het?
Volgens Gartner gaat het bij big data om drie factoren:

  • de hoeveelheid data;
  • de snelheid waarmee de data binnenkomen en/of opgevraagd worden;
  • de diversiteit van de data.

Over het algemeen zijn het datasets die te groot om met reguliere databasemanagementsystemen te onderhouden en is ook de structuur (of eigenlijk vaak het gebrek aan structuur) iets waar de reguliere systemen moeite mee hebben.

Waar komt het vandaan?
De hoeveelheid data is de laatste jaren exponentieel gegroeid en die groei zal alleen maar doorzetten in de toekomst. Dit wordt onder andere veroorzaakt doordat mensen zelf steeds meer data opslaan (denk aan alle informatie en foto’s op facebook maar bijvoorbeeld ook aan de trend op het gebied van health wearables). Daarnaast zijn er ook alsmaar meer apparaten die data opslaan, verzamelen en uitwisselen (auto’s, koelkasten en zelfs hondenhalsbanden; dit is weer een heel andere trend genaamd ‘Internet of Things’). Tot slot is er ook steeds meer sensordata beschikbaar. Deze grote hoeveelheden data zorgen voor een technische uitdaging in de omgang (de hoeveelheid opslaan is niet perse het probleem maar het beheren en eenvoudig en snel kunnen benaderen is ook belangrijk) maar ook de analyse speelt een steeds grotere rol. Daarmee zijn we eigenlijk meteen bij het volgende punt beland.

Wat kun je ermee?
Een veel gebruikt voorbeeld dat tot de verbeelding spreekt is dat van het Amerikaanse warenhuis Target. Op basis van een database vol met historisch en actueel koopgedrag stuurt Target gerichte aanbiedingen naar klanten. Een van de campagnes richtte zich op aankomende moeders. Op basis van vergelijkingen van klanten en wijzigingen in het aankoopgedrag kan Target bepalen of een klant zwanger is. Het verhaal gaat dat een tiener in verwachting een persoonlijke aanbiedingen ontving nog voordat ze het grote nieuws met haar ouders had gedeeld. Bedankt Target!

Nu heeft natuurlijk niet iedereen zo’n grote hoeveelheid data beschikbaar. Echter kun je tegenwoordig ook je eigen data verrijken door gebruik te maken van online beschikbare data of door data in te kopen. Door dalende technologie-kosten en door het steeds gebruiksvriendelijker worden van analyse tools is het dus niet meer alleen voor de grote bedrijven weggelegd.

Kleinere bedrijven kunnen zo bijvoorbeeld gebruik maken van online data van sociale netwerken, commercieel beschikbare databases of meer gespecialiseerde databases. Vul je eigen  klantinformatie over prijsgeschiedenis en aankooppatronen aan met online beschikbare data van je website of social media. Leg een kruisreferentie en voorspel vervolgens beter de behoeftes van je klanten om de omzet te kunnen verhogen.

En verder?
De volgende term heeft zich alweer aangediend: een ‘data lake’ oftewel een ‘data meer’. James Dixon, CTO van Pentaho, geeft een mooie beschrijving die tot de verbeelding spreekt: waar een datamart kan worden gezien als een flesje water – schoongemaakt en verpakt voor eenvoudige consumptie – is een data lake een enorme hoeveelheid water in een meer natuurlijke staat. De inhoud van het meer komt binnen uit meerdere bronnen en gebruikers kunnen het meer bestuderen, erin duiken of een sample afnemen.

Wat gaat de toekomst brengen? Wie weten stromen straks wel alle ‘data lakes’ via beekjes en rivieren naar een ‘data sea’. En later blijkt die ‘data sea’ zich in een grote ‘data ocean’ te bevinden waarin de hele wereld in kan gaan vissen.