Diumumkan pada Mei 2025: Dataproc Serverless kini menjadi Google Cloud Serverless untuk Apache Spark

Logo Serverless untuk Apache Spark

Google Cloud Serverless untuk Apache Spark

Fokus pada kode, bukan infrastruktur

Jalankan tugas Apache Spark Anda lebih mudah di platform tanpa pengoperasian yang dapat disesuaikan, lebih cerdas dengan bantuan Gemini, dan lebih cepat dengan performa Lightning Engine.

Apache Spark adalah merek dagang dari Apache Software Foundation.


Fitur

Performa terbaik di industri

Optimalkan pekerjaan Anda dengan Lightning Engine, mesin vektorisasi generasi berikutnya. Dapatkan performa 4,3x lebih cepat dan TCO yang lebih rendah untuk workload Spark serverless Anda, secara otomatis.

Tanpa pengoperasian dengan penskalaan otomatis yang cerdas

Hilangkan pengelolaan cluster dengan penskalaan otomatis yang cerdas. Resource ditingkatkan dan diturunkan skalanya secara otomatis agar sesuai dengan kebutuhan tugas Anda, sehingga memastikan performa maksimal dan efisiensi biaya tanpa membayar waktu tidak ada aktivitas.

Pengembangan yang didukung AI

Percepat seluruh alur kerja Anda. Tulis dan debug kode PySpark, Scala, dan Java dengan Gemini Code Assist di BigQuery Studio dan luncurkan lingkungan yang dipercepat GPU dengan Runtime ML yang telah dikonfigurasi sebelumnya.

Pengalaman Spark dan SQL yang terpadu

Hilangkan pengalihan konteks. Kembangkan dan jalankan workload Anda dalam satu lingkungan seperti BigQuery Studio, yang memadukan SQL yang canggih dengan fleksibilitas PySpark dalam notebook yang sama.


Dua tingkat performa

Dua tingkat performaTingkatan yang sesuai dengan kebutuhan spesifik Anda, mulai dari batch processing standar hingga pekerjaan yang paling menuntut dan mementingkan performa.
TingkatPaling cocok untuk

Standar

Ideal untuk batch processing yang hemat biaya, transformasi data, dan tugas Spark tujuan umum.

  • ETL Spark tujuan umum
  • Pipeline data terjadwal
  • Tugas batch yang sensitif terhadap biaya

Premium

Untuk workload yang paling menuntut, menawarkan performa maksimal dengan Lightning Engine, akselerasi AI/ML, dan kemampuan interaktif.

  • Tugas yang mementingkan performa yang didukung oleh Lightning Engine untuk peningkatan 4,3x lipat
  • Analisis dan data science interaktif
  • AI dan ML yang dipercepat GPU
  • Pemrosesan data yang kompleks dan berskala besar

Dua tingkat performa

Tingkatan yang sesuai dengan kebutuhan spesifik Anda, mulai dari batch processing standar hingga pekerjaan yang paling menuntut dan mementingkan performa.

Standar

Paling cocok untuk

Ideal untuk batch processing yang hemat biaya, transformasi data, dan tugas Spark tujuan umum.

  • ETL Spark tujuan umum
  • Pipeline data terjadwal
  • Tugas batch yang sensitif terhadap biaya

Premium

Paling cocok untuk

Untuk workload yang paling menuntut, menawarkan performa maksimal dengan Lightning Engine, akselerasi AI/ML, dan kemampuan interaktif.

  • Tugas yang mementingkan performa yang didukung oleh Lightning Engine untuk peningkatan 4,3x lipat
  • Analisis dan data science interaktif
  • AI dan ML yang dipercepat GPU
  • Pemrosesan data yang kompleks dan berskala besar

Cara Kerjanya

Kembangkan aplikasi Apache Spark Anda di alat favorit Anda, termasuk notebook BigQuery Studio. Kirim tugas Spark serverless Anda dengan satu perintah, dan biarkan Google menangani sisanya—tidak ada cluster yang perlu dibuat, dikonfigurasi, atau dikelola.


Penggunaan Umum

Data Science Interaktif

Dukung data scientist untuk mengeksplorasi data dan melakukan iterasi dengan cepat pada model Spark ML. Satukan SQL dan Spark dalam satu notebook BigQuery Studio, sehingga beralih dengan lancar dari eksplorasi data dengan SQL ke pembuatan model dengan PySpark tanpa perlu mengelola infrastruktur.

Notebook BQ Studio

Data Science Interaktif

Dukung data scientist untuk mengeksplorasi data dan melakukan iterasi dengan cepat pada model Spark ML. Satukan SQL dan Spark dalam satu notebook BigQuery Studio, sehingga beralih dengan lancar dari eksplorasi data dengan SQL ke pembuatan model dengan PySpark tanpa perlu mengelola infrastruktur.

Notebook BQ Studio

Pipeline ETL Otomatis

 Buat pipeline ETL Spark berbasis peristiwa yang tangguh dan otomatis diskalakan sesuai permintaan. Hanya bayar sesuai penggunaan, sehingga cocok untuk workload yang tidak terduga atau tidak stabil.

Dari data ke produksi Spark, lebih cepat.

    Pipeline ETL Otomatis

     Buat pipeline ETL Spark berbasis peristiwa yang tangguh dan otomatis diskalakan sesuai permintaan. Hanya bayar sesuai penggunaan, sehingga cocok untuk workload yang tidak terduga atau tidak stabil.

    Dari data ke produksi Spark, lebih cepat.

      AI/ML dalam skala besar

      Mempercepat pelatihan model skala besar dan inferensi batch dengan Spark serverless. Hubungkan GPU NVIDIA dengan library yang telah dikonfigurasi sebelumnya dengan satu perintah.

      Slide

        AI/ML dalam skala besar

        Mempercepat pelatihan model skala besar dan inferensi batch dengan Spark serverless. Hubungkan GPU NVIDIA dengan library yang telah dikonfigurasi sebelumnya dengan satu perintah.

        Slide

          Harga

          Harga yang transparan dan berbasis nilaiHarga Serverless untuk Apache Spark didasarkan pada penggunaan komputasi (DCU), GPU, dan penyimpanan shuffle per detik.
          Layanan dan penggunaanJenis langganan Harga (USD)

          Unit Komputasi Data (DCU)

          Standar

          Mulai dari

          $0,06

          per jam

          Premium

          Mulai dari

          $0,089

          per jam

          Penyimpanan shuffle

          Standar

          Mulai dari

          $0,04

          per GB/bulan

          Premium

          Mulai dari

          $0,1

          per GB/bulan

          Harga akselerator

          a100 40 GB

          Mulai dari

          $3,52069

          per jam

          a100 80 GB

          Mulai dari

          $4,713696

          per jam

          L4

          Mulai dari

          $0,672048

          per jam

          Lihat detail harga untuk Google Cloud Serverless untuk Apache Spark.

          Harga yang transparan dan berbasis nilai

          Harga Serverless untuk Apache Spark didasarkan pada penggunaan komputasi (DCU), GPU, dan penyimpanan shuffle per detik.

          Unit Komputasi Data (DCU)

          Jenis langganan

          Standar

          Harga (USD)

          Starting at

          $0,06

          per jam

          Premium

          Jenis langganan

          Starting at

          $0,089

          per jam

          Penyimpanan shuffle

          Jenis langganan

          Standar

          Harga (USD)

          Starting at

          $0,04

          per GB/bulan

          Premium

          Jenis langganan

          Starting at

          $0,1

          per GB/bulan

          Harga akselerator

          Jenis langganan

          a100 40 GB

          Harga (USD)

          Starting at

          $3,52069

          per jam

          a100 80 GB

          Jenis langganan

          Starting at

          $4,713696

          per jam

          L4

          Jenis langganan

          Starting at

          $0,672048

          per jam

          Lihat detail harga untuk Google Cloud Serverless untuk Apache Spark.

          Kalkulator harga

          Hitung biaya bulanan Anda menurut region.

          Penawaran kustom

          Hubungi tim penjualan kami untuk mendapatkan penawaran harga khusus bagi organisasi Anda.

          Mulai sekarang juga

          Tutorial untuk memulai

          Punya proyek besar?

          Dokumentasi produk

          Menggunakan konektor BigQuery dengan Serverless untuk Apache Spark

          Menggunakan GPU dengan Serverless untuk Apache Spark

          Kasus Bisnis

           Membangun kasus bisnis Anda untuk Google Cloud Serverless untuk Apache Spark


          Manfaat ekonomi Google Cloud Dataproc dan Serverless Spark dibandingkan solusi alternatif

          Lihat bagaimana Serverless untuk Apache Spark memberikan penghematan TCO dan nilai bisnis yang signifikan dibandingkan dengan solusi lokal dan cloud lainnya.

          Dalam laporan:

          Temukan bagaimana Dataproc dan Serverless untuk Apache Spark dapat memberikan penghematan biaya sebesar 18% hingga 60% dibandingkan dengan alternatif Spark berbasis cloud lainnya.

          Pelajari cara Google Cloud Serverless untuk Apache Spark memberikan performa harga 21% hingga 55% lebih baik dibandingkan penawaran Spark serverless lainnya.

          Pelajari cara Dataproc dan Google Cloud Serverless untuk Apache Spark menyederhanakan deployment Spark dan membantu mengurangi kompleksitas operasional.

          FAQ

          Kapan saya harus memilih Serverless untuk Apache Spark dibandingkan Dataproc?

          Pilih Serverless untuk Apache Spark jika Anda ingin berfokus pada kode dan menghilangkan semua pengelolaan infrastruktur. Ini sangat ideal untuk pipeline Spark baru, analisis interaktif, dan tugas dengan permintaan yang tidak dapat diprediksi, di mana kecepatan dan kesederhanaan menjadi prioritas.

          Lihat panduan keputusan kami.

          Tingkat Premium dirancang untuk AI/ML dan dilengkapi dengan Runtime ML yang telah dikonfigurasi sebelumnya yang memiliki library umum seperti PyTorch, XGBoost, dan scikit-learn bawaan. Hal ini menghilangkan penyiapan yang rumit dan memungkinkan Anda memulai workload data science dalam hitungan menit.

          Pelajari workload dan runtime GPU.

          Untuk performa maksimal, Anda dapat memilih tingkat Premium, yang didukung oleh Lightning Engine. Harga didasarkan pada model "bayar sesuai penggunaan", di mana Anda ditagih per detik hanya untuk durasi eksekusi tugas Anda. Hal ini sangat hemat biaya karena menghilangkan biaya cluster yang tidak digunakan.

          Lihat harga mendetail.