Cloud Dataproc

Een snellere, eenvoudigere en voordelige manier om Spark en Hadoop uit te voeren

Kosteloos uitproberen

Cloudeigen Hadoop en Spark

Cloud Dataproc is een snelle, gebruiksvriendelijke en volledig beheerde cloudservice waarmee u Apache Spark- en Apache Hadoop-clusters eenvoudiger en voordeliger kunt uitvoeren. Bewerkingen die vroeger uren of dagen in beslag namen, duren nu nog maar seconden of minuten. Daarnaast betaalt u alleen voor de resources die u daadwerkelijk gebruikt (met facturering per seconde). Cloud Dataproc is eenvoudig te integreren met andere Google Cloud Platform-services (GCP). Zo beschikt u over een krachtig en compleet platform voor gegevensverwerking, analyse en machine learning.

Beheerde Hadoop en Spark

Snelle en schaalbare gegevensverwerking

Maak snel Cloud Dataproc-clusters en pas de grootte op elk gewenst moment aan van drie tot honderden knooppunten. U hoeft niet bang te zijn dat uw gegevenspipelines te groot worden voor uw clusters. Omdat elke clusterhandeling gemiddeld minder dan 90 seconden duurt, heeft u meer tijd om u op inzichten te richten en bent u minder tijd kwijt aan de infrastructuur.

Snelle en schaalbare gegevensverwerking

Betaalbare prijzen

In lijn met de prijsstructuur van Google Cloud Platform zijn de kosten voor Cloud Dataproc laag en is de overzichtelijke prijsstructuur gebaseerd op daadwerkelijk gebruik, gemeten per seconde. Cloud Dataproc-clusters kunnen bovendien goedkopere preëmptieve processen bevatten, waarmee u krachtige clusters krijgt tegen nog lagere totale kosten.

Betaalbare prijzen

Open source-ecosysteem

Het ecosysteem van Spark en Hadoop biedt tools, bibliotheken en documentatie die u kunt gebruiken met Cloud Dataproc. Dankzij de regelmatig geüpdatete en systeemeigen versies van Spark, Hadoop, Pig en Hive kunt u aan de slag zonder nieuwe tools of API's te hoeven leren en kunt u bestaande projecten en ETL-pipelines verplaatsen zonder deze opnieuw te ontwikkelen.

Open source-ecosysteem

Functies van Cloud Dataproc

Google Cloud Dataproc is een snelle, gemakkelijk te gebruiken en voordelige, beheerde Spark- en Hadoop-service.

Geautomatiseerd clusterbeheer
Dankzij de beheerde implementatie, logboeken en controle kunt u zich richten op uw gegevens, niet op uw cluster. Uw clusters blijven stabiel, schaalbaar en snel.
Schaalbare clusters
Clusters kunnen snel worden gemaakt en geschaald met diverse VM-typen, schijfgroottes, aantallen knooppunten en netwerkopties.
Geïntegreerd
De ingebouwde integratie met Cloud Storage, BigQuery, Bigtable, Stackdriver Logging en Stackdriver Monitoring biedt u een compleet en robuust gegevensplatform.
Versiebeheer
Versiebeheer van images maakt het mogelijk om tussen verschillende versies van Apache Spark, Apache Hadoop en andere tools te wisselen.
Hoge beschikbaarheid
Voer clusters met meerdere hoofdknooppunten uit en stel in dat taken opnieuw worden opgestart bij fouten. Zo zorgt u voor een hoge beschikbaarheid van uw clusters en taken.
Ontwikkelaarstools
Meerdere manieren om een cluster te beheren, waaronder een gemakkelijk te gebruiken web-UI, de Google Cloud SDK, RESTful API's en SSH-toegang.
Initialisatieacties
Voer tijdens het maken van uw cluster initialisatieacties uit om de instellingen en bibliotheken die u nodig heeft, te installeren of aan te passen.
Automatische of handmatige configuratie
Cloud Dataproc configureert automatisch hardware en software op clusters, maar biedt ook handmatig beheer.
Flexibele virtuele machines
Clusters kunnen aangepaste machinetypen en verwijderbare virtuele machines gebruiken en kunnen dus perfect worden afgestemd op uw behoeften.

Prijzen van Cloud Dataproc

Voor Cloud Dataproc wordt een klein, oplopend tarief in rekening gebracht per virtuele CPU in de Compute Engine-instanties die in uw cluster worden gebruikt1.

Iowa Oregon Northern Virginia South Carolina São Paulo België Londen Frankfurt Sydney Taiwan Tokio
Type machine Prijs
Standaardmachines
1-64 virtuele CPU's
Machines met veel geheugen
2-64 virtuele CPU's
Machines met hoog CPU
2-64 virtuele CPU's
Aangepaste machines
Gebaseerd op vCPU- en geheugengebruik
Als u in een andere valuta dan USD betaalt, gelden de prijzen die in uw valuta op Cloud Platform SKU's worden getoond.

1 Voor Cloud Dataproc wordt een klein, oplopend tarief in rekening gebracht per virtuele CPU in de Compute Engine-instanties die in uw cluster worden gebruikt wanneer uw cluster actief is. Extra resources die door Cloud Dataproc worden gebruikt - zoals een Compute Engine-netwerk, BigQuery en Cloud Bigtable - worden gefactureerd naar gebruik. Bekijk het prijsoverzicht voor uitgebreide prijsinformatie.