Dukungan BigQuery native untuk Apache Spark serta SQL. Pelajari lebih lanjut.

Spark di Google Cloud

Tingkatkan produktivitas developer dengan Serverless Spark dan penskalaan otomatis pertama di industri yang terintegrasi dengan alat asli Google dan open source terbaik. Kembangkan dan jalankan Spark di tempat yang membutuhkannya pada semua kasus penggunaan, termasuk ETL, data science, dan eksplorasi.

Manfaat

Meningkatkan produktivitas developer dan mendapatkan insight data lebih cepat

Kemudahan operasional melalui Serverless Spark

Tulis aplikasi dan pipeline Spark yang otomatis diskalakan tanpa penyediaan atau penyesuaian infrastruktur manual apa pun.

Spark tanpa hambatan untuk semua pengguna data

Spark terintegrasi dengan BigQuery, Vertex AI, dan Dataplex, sehingga Anda dapat menulis kode dan menjalankannya dari antarmuka tersebut hanya dengan dua klik, tanpa integrasi kustom, untuk ETL, eksplorasi data, analisis, dan ML.

Fleksibilitas pemakaian

Tidak ada solusi tunggal untuk semua situasi. Anda dapat memilih antara serverless, cluster Kubernetes, dan cluster komputasi untuk aplikasi Spark Anda.

Fitur utama

Menjalankan tugas Spark yang otomatis diskalakan, dari antarmuka pilihan Anda, dengan dua klik

Data science dengan Spark serverless

Spark serverless Google Cloud mempercepat data science dengan mengotomatiskan infrastruktur. Berfokuslah di kode, bukan pengelolaan cluster. Penskalaan otomatis dan pengintegrasian yang lancar dengan BigQuery dan Vertex AI menyederhanakan alur kerja, sehingga memungkinkan iterasi dan pengembangan model yang lebih cepat. Lihat library terbaru untuk Spark serverless guna mendukung lebih banyak kasus penggunaan dengan konfigurasi pengguna yang lebih sedikit. Lihat contoh kode terbaru untuk data scientist, termasuk membangun pipeline guna memprediksi churn pelanggan menggunakan Apache Spark, XGBoost, dan library Hugging Face Transformer.

Spark melalui Vertex AI

Spark untuk data science dengan satu klik: Data scientist dapat menggunakan Spark untuk mengembangkan aplikasi dari Vertex AI Workbench tanpa hambatan, dengan keamanan bawaan. Spark terintegrasi dengan fitur MLOps di Vertex AI, tempat pengguna dapat mengeksekusi kode Spark melalui eksekutor notebook yang terintegrasi dengan Vertex AI Pipelines.

Prosedur eksternal BigQuery untuk Apache Spark

Pengalaman SQL dan Spark terpadu: Buat dan jalankan kode Apache Spark yang ditulis di Python, langsung dari BigQuery. Selanjutnya Anda dapat menjalankan dan menjadwalkan prosedur yang tersimpan ini di BigQuery menggunakan kueri SQL standar Google, mirip dengan menjalankan prosedur SQL tersimpan.

Serverless Spark

Developer dapat berfokus pada penulisan kode dan logika, lalu menggunakan antarmuka pilihan mereka untuk mengirim tugas Spark, yang otomatis disediakan dan diskalakan. Baca dokumentasi untuk Serverless Spark

Spark melalui Dataplex

Jalankan Spark penskalaan otomatis pada data di seluruh Google Cloud dari antarmuka tunggal yang memiliki akses sekali klik ke SparkSQL, Notebooks, atau PySpark. Spark juga menawarkan kolaborasi yang mudah dengan kemampuan untuk menyimpan, membagikan, menelusuri notebook dan skrip bersama data, serta tata kelola bawaan di seluruh data lake. 

Siap untuk memulai? Hubungi kami


Spark adalah merek dagang dari Apache Software Foundation.

Langkah selanjutnya

Beri tahu kami masalah yang ingin Anda pecahkan. Pakar Google Cloud akan membantu Anda menemukan solusi terbaik.