Dokumentasi Dataproc
Dataproc adalah layanan Apache Spark dan Apache Hadoop terkelola yang memungkinkan Anda memanfaatkan alat data open source untuk batch processing, pembuatan kueri, streaming, dan machine learning. Otomatisasi Dataproc membantu Anda membuat cluster dengan cepat, mengelolanya dengan mudah, dan menghemat biaya dengan menonaktifkan cluster saat tidak diperlukan. Dengan lebih sedikit waktu dan uang yang dihabiskan untuk tugas administrasi, Anda dapat berfokus pada pekerjaan dan data Anda. Pelajari lebih lanjut
Mulai project baru Anda dengan kredit gratis senilai $300
Buat dan uji bukti konsep dengan kredit uji coba gratis dan penggunaan gratis bulanan untuk lebih dari 20 produk.
Teruslah menjelajah dengan lebih dari 20 produk yang selalu gratis
Akses 20+ produk gratis untuk kasus penggunaan umum, termasuk API AI, VM, data warehouse, dan lainnya.
Referensi dokumentasi
Panduan
-
Panduan memulai: Konsol, Command-line, Library Klien, APIs Explorer—Buat cluster, atau APIs Explorer—Kirim tugas Spark
-
Ringkasan Template Alur Kerja Dataproc
-
Panduan Memulai Dataproc di GKE
-
Mengonfigurasi Dataproc Hub
-
Membuat Image Kustom Dataproc
-
Menulis tugas MapReduce dengan konektor BigQuery
-
Menggunakan konektor Cloud Storage dengan Apache Spark
-