Cloud Dataproc

Un modo più veloce, facile ed economico per eseguire Spark e Hadoop

Provalo gratis

Hadoop e Spark nativi su cloud

Cloud Dataproc è un servizio cloud veloce, facile da utilizzare e completamente gestito per eseguire i cluster Apache Spark e Apache Hadoop in maniera più semplice ed economica. Le operazioni che prima richiedevano ore o giorni adesso vengono eseguite in secondi o minuti. Inoltre, paghi solo le risorse che utilizzi (con fatturazione al secondo). Cloud Dataproc si integra senza problemi con altri servizi Google Cloud Platform (GCP), offrendo una piattaforma completa e avanzata per l'elaborazione dati, l'analisi e il machine learning.

Hadoop e Spark gestito

Elaborazione dati veloce e scalabile

Crea rapidamente i cluster di Cloud Dataproc e ridimensionali in qualsiasi momento, da tre a centinaia di nodi, in modo da non doverti preoccupare se le pipeline dei dati superano le dimensioni dei cluster. Ogni azione del cluster richiede in media meno di 90 secondi, quindi hai più tempo per concentrarti sulle informazioni, eliminando gli sprechi di tempo associati alla gestione dell'infrastruttura.

Elaborazione dati veloce e scalabile

Prezzi contenuti

Adottando i principi tariffari di Google Cloud Platform, Cloud Dataproc ha un costo contenuto e una struttura dei prezzi di semplice comprensione, basata sull'utilizzo effettivo al secondo. I cluster di Cloud Dataproc possono inoltre includere istanze prerilasciabili a basso costo, offrendo così cluster avanzati a un costo totale ancora più contenuto.

Prezzi contenuti

Ecosistema open source

L'ecosistema di Spark e Hadoop fornisce strumenti, librerie e documenti che possono essere utilizzati con Cloud Dataproc. Grazie alle versioni native e frequentemente aggiornate di Spark, Hadoop, Pig e Hive, puoi iniziare senza dover imparare nuovi strumenti o API e trasferire progetti esistenti o pipeline ETL senza dover ridefinire lo sviluppo.

Ecosistema open source

Funzionalità di Cloud Dataproc

Google Cloud Dataproc è un servizio Spark e Hadoop gestito veloce, facile da usare e a basso costo.

Gestione automatica dei cluster
L'implementazione, la registrazione e il monitoraggio gestiti consentono di concentrarsi sui dati, non sui cluster. I tuoi cluster saranno stabili, scalabili e veloci.
Cluster ridimensionabili
È possibile creare e ridimensionare rapidamente i cluster con un'ampia gamma di tipi di macchine virtuali, dimensioni dei dischi, numeri di nodi e opzioni di rete.
Integrato
Integrazione incorporata con Cloud Storage, BigQuery, Bigtable, Stackdriver Logging e Stackdriver Monitoring per una piattaforma dati completa e solida.
Controllo versioni
Il controllo versioni delle immagini consente di passare da una versione all'altra di Apache Spark, Apache Hadoop e altri strumenti.
Disponibilità elevata
Esegui cluster con più nodi master e imposta job di riavvio in caso di errore in modo che cluster e job siano sempre altamente disponibili.
Strumenti per sviluppatori
Diversi modi per gestire un cluster, tra cui un'interfaccia utente web di facile utilizzo, Google Cloud SDK, API RESTful e accesso SSH.
Azioni di inizializzazione
Esegui azioni di inizializzazione per installare o personalizzare le impostazioni e le librerie necessarie quando viene creato il cluster.
Configurazione automatica o manuale
Cloud Dataproc configura automaticamente hardware e software sui cluster, consentendo al tempo stesso il controllo manuale.
Macchine virtuali flessibili
I cluster possono utilizzare tipi di macchine virtuali personalizzate e macchine virtuali prerilasciabili le cui dimensioni si adattano quindi perfettamente alle tue esigenze.

Prezzi di Cloud Dataproc

Cloud Dataproc comporta una piccola tariffa incrementale per CPU virtuale nelle istanze di Compute Engine utilizzate nel cluster1.

Iowa Oregon Virginia del Nord Carolina del Sud San Paolo Belgio Londra Francoforte Sydney Taiwan Tokyo
Tipo di macchina Prezzo
Macchine standard
1-64 CPU virtuali
Macchine con memoria elevata
2-64 CPU virtuali
Macchine con CPU elevata
2-64 CPU virtuali
Macchine personalizzate
In base all'utilizzo di vCPU e memoria
Se la valuta utilizzata per il pagamento è diversa da USD, si applicano i prezzi elencati nella propria valuta negli SKU di Cloud Platform.

1 Cloud Dataproc comporta una piccola tariffa incrementale per CPU virtuale nelle istanze di Compute Engine utilizzate nel cluster quando il cluster è operativo. I costi di ulteriori risorse utilizzate da Cloud Dataproc, ad esempio rete di Compute Engine, BigQuery, Cloud Bigtable e altre, vengono addebitati in base al consumo. Per informazioni più dettagliate sui prezzi, consulta la guida ai prezzi.