Dukungan BigQuery native untuk Apache Spark serta SQL. Pelajari lebih lanjut.

Spark di Google Cloud

Tingkatkan produktivitas developer dengan Serverless Spark dan penskalaan otomatis pertama di industri yang terintegrasi dengan alat asli Google dan open source terbaik. Kembangkan dan jalankan Spark di tempat yang membutuhkannya pada semua kasus penggunaan, termasuk ETL, data science, dan eksplorasi.

Manfaat

Meningkatkan produktivitas developer dan mendapatkan insight data lebih cepat

Kemudahan operasional melalui Serverless Spark

Tulis aplikasi dan pipeline Spark yang otomatis diskalakan tanpa penyediaan atau penyesuaian infrastruktur manual apa pun.

Spark tanpa hambatan untuk semua pengguna data

Spark terintegrasi dengan BigQuery, Vertex AI, dan Dataplex, sehingga Anda dapat menulis kode dan menjalankannya dari antarmuka tersebut hanya dengan dua klik, tanpa integrasi kustom, untuk ETL, eksplorasi data, analisis, dan ML. 

Fleksibilitas pemakaian

Tidak ada solusi tunggal untuk semua situasi. Anda dapat memilih antara serverless, cluster Kubernetes, dan cluster komputasi untuk aplikasi Spark Anda.

Fitur utama

Menjalankan tugas Spark yang otomatis diskalakan, dari antarmuka pilihan Anda, dengan dua klik

Prosedur eksternal BigQuery untuk Apache Spark

Pengalaman SQL dan Spark terpadu: Buat dan jalankan kode Apache Spark yang ditulis di Python, langsung dari BigQuery. Selanjutnya Anda dapat menjalankan dan menjadwalkan prosedur yang tersimpan ini di BigQuery menggunakan kueri SQL standar Google, mirip dengan menjalankan prosedur SQL tersimpan.

Serverless Spark

Developer dapat berfokus pada penulisan kode dan logika, lalu menggunakan antarmuka pilihan mereka untuk mengirim tugas Spark, yang otomatis disediakan dan diskalakan. Baca dokumentasi untuk Serverless Spark

Spark melalui Vertex AI

Spark untuk data science dengan satu klik: Data scientist dapat menggunakan Spark untuk mengembangkan aplikasi dari Vertex AI Workbench tanpa hambatan, dengan keamanan bawaan. Spark terintegrasi dengan fitur MLOps di Vertex AI, tempat pengguna dapat mengeksekusi kode Spark melalui eksekutor notebook yang terintegrasi dengan Vertex AI Pipelines.

Spark melalui Dataplex

Jalankan Spark penskalaan otomatis pada data di seluruh Google Cloud dari antarmuka tunggal yang memiliki akses sekali klik ke SparkSQL, Notebooks, atau PySpark. Spark juga menawarkan kolaborasi yang mudah dengan kemampuan untuk menyimpan, membagikan, menelusuri notebook dan skrip bersama data, serta tata kelola bawaan di seluruh data lake. 

Opsi pemakaian yang fleksibel

Selain Serverless Spark untuk deployment tanpa pengoperasian, pelanggan yang menjalankan standardisasi di Kubernetes untuk pengelolaan infrastruktur dapat menjalankan Spark di Google Kubernetes Engine untuk meningkatkan pemanfaatan resource dan menyederhanakan pengelolaan infrastruktur. Pelanggan yang menginginkan pengelolaan infrastruktur dengan gaya Hadoop dapat menjalankan Spark di Compute Engine.

Siap untuk memulai? Hubungi kami


Spark adalah merek dagang dari Apache Software Foundation.

Langkah selanjutnya

Beri tahu kami masalah yang ingin Anda pecahkan. Pakar Google Cloud akan membantu Anda menemukan solusi terbaik.

Google Cloud
  • ‪English‬
  • ‪Deutsch‬
  • ‪Español‬
  • ‪Español (Latinoamérica)‬
  • ‪Français‬
  • ‪Indonesia‬
  • ‪Italiano‬
  • ‪Português (Brasil)‬
  • ‪简体中文‬
  • ‪繁體中文‬
  • ‪日本語‬
  • ‪한국어‬
Konsol
Google Cloud