Wat is big data?

Big data verwijst naar gegevens die doorgaans te duur zijn om op te slaan, te beheren en te analyseren met behulp van traditionele (relationele en/of monolithische) databasesystemen. Dergelijke systemen zijn gewoonlijk niet kostenefficiënt doordat ze niet flexibel genoeg zijn om ongestructureerde gegevens (zoals afbeeldingen, tekst en video) op te slaan, 'high-speed' (real-time) gegevens af te handelen of om op te schalen naar zeer grote gegevensvolumes (petabyte-schaal).

Daarom zijn de afgelopen jaren nieuwe benaderingen gemeengoed geworden om big data te beheren en te verwerken, waaronder Apache Hadoop en NoSQL-databasesystemen. Deze opties blijken echter vaak te complex te zijn om op locatie te implementeren, beheren en gebruiken.

Waar komt big data vandaan?

In het verleden konden de meeste klantgegevens worden gecategoriseerd als goed gestructureerde transacties, zoals banktransacties. Maar tegenwoordig produceren organisaties dagelijks een veelheid aan ongestructureerde online klantinteractiegegevens waarbij de gegevens van een paar jaar geleden in het niet vallen. De recente opkomst van het 'Internet of Things', oftewel het wereldwijde netwerk van miljarden onderling verbonden apparaten en sensoren, heeft een enorme toename van de hoeveelheid gegevens in de vorm van tekst, video, afbeeldingen en zelfs audio veroorzaakt. Tot slot moeten gegevens die anders zouden worden gearchiveerd in sommige gereguleerde branches nu om nalevingsredenen toegankelijk blijven.

Waarom is big data belangrijk?

Succesvolle organisaties in elke branche en van elke omvang willen op consistente wijze zakelijk voordeel uit gegevens halen. In sommige branches (zoals detailhandel, reclame en financiële dienstverlening, en de lijst wordt steeds langer) is dit zelfs een voorwaarde om te overleven.

Gegevensanalyse levert alleen meer waarde op wanneer u toegang hebt tot meer gegevens, dus organisaties in verschillende branches gebruiken big data om diepgaande zakelijke inzichten te verkrijgen. En omdat machinelearning-modellen efficiënter worden naarmate ze met meer gegevens worden 'getraind', zijn machine learning en big data uitermate complementair.

Hoe weet ik of mijn gegevens 'big data' zijn?

Hoewel de gegevensvolumes van veel ondernemingen nog niet de petabyteschaal hebben bereikt, bezitten de gegevens wellicht een van de andere twee karakteristieke kenmerken van big data. En uw hoeveelheid gegevens zal in de loop van de tijd ongetwijfeld toenemen, waarschijnlijk zelfs exponentieel. In die zin begint alle 'big data' als 'small data'.

Waarom is de cloud het beste platform voor big data?

Cloudcomputing biedt toegang tot opslag, verwerking en analyse van gegevens op een schaalbare, flexibele, kostenefficiënte en zelfs veilige basis, meer dan met een implementatie op locatie kan worden bereikt. Deze kenmerken zijn essentieel voor klanten wanneer gegevensvolumes exponentieel groeien, zodat opslag- en verwerkingsbronnen beschikbaar zijn wanneer dat nodig is en om waarde uit die gegevens te halen. Voor organisaties die net beginnen met het uitvoeren van big data-analyse en machine learning en die de potentiële complexiteit van bigdata-systemen op locatie willen vermijden, biedt de cloud een manier om te experimenteren met beheerde services (zoals Google BigQuery en Google Cloud ML Engine) en die te betalen op basis van gebruik.

Meer informatie: