Dataproc-Dokumentation
Dataproc ist ein verwalteter Apache Spark- und Apache Hadoop-Dienst, mit dem Sie Open-Source-Datentools für Batchverarbeitung, Abfragen, Streaming und maschinelles Lernen nutzen können. Mithilfe der Dataproc-Automatisierung lassen sich Cluster schnell erstellen, einfach verwalten und Kosten senken, weil Sie nicht mehr benötigte Cluster deaktivieren können. Außerdem haben Sie so die Möglichkeit sich stärker auf Jobs und Daten zu konzentrieren. Weitere Informationen
Starten Sie Ihr nächstes Projekt mit einem Guthaben in Höhe von 300 $
Mit dem Guthaben für die kostenlose Testversion und der kostenlosen monatlichen Nutzung von mehr als 20 Produkten können Sie einen Proof of Concept erstellen und testen.
Mehr als 20 Produkte immer kostenlos nutzen
Sie haben Zugriff auf mehr als 20 kostenlose Produkte für gängige Anwendungsfälle, darunter KI-APIs, VMs, Data Warehouses und mehr.
Dokumentationsressourcen
Leitfäden
-
Kurzanleitungen: Console, Befehlszeile, Clientbibliotheken, APIs Explorer – Cluster erstellen oder APIs Explorer – Spark-Job senden
-
Übersicht über Dataproc-Workflow-Vorlagen
-
Kurzanleitung für Dataproc auf GKE
-
Dataproc-Hub konfigurieren
-
Benutzerdefiniertes Dataproc-Image erstellen
-
MapReduce-Job mit dem BigQuery-Connector schreiben
-
Cloud Storage-Connector mit Apache Spark verwenden
-