Data science di Google Cloud

Platform terpadu untuk pengelolaan data, analisis, dan alat machine learning guna mempercepat alur kerja data ke AI Anda.

Panduan praktis untuk data science dengan Google Cloud

Alasan memilih Google Cloud untuk data science

Platform data dan AI terpadu Google Cloud

Meningkatkan kecepatan dan fleksibilitas bisnis Anda, serta memberikan nilai jangka pendek dan panjang.

3x


Lebih hemat biaya dengan pergerakan data yang minimal

4x


Pelatihan, penyesuaian, dan deployment model yang lebih cepat

10x


Biaya AI lebih rendah, sehingga sasaran ROI lebih mudah dicapai

Alat terintegrasi untuk data science

Platform terpadu untuk alur kerja data science menyeluruh

Solusi terpadu untuk seluruh siklus proses data science dan machine learning yang dibangun di atas fondasi data multimodal yang memastikan tata kelola terpadu. Manfaatkan mesin analisis yang canggih seperti BigQuery SQL dan Spark, lalu bangun model menggunakan BigQuery ML atau Vertex AI. Sederhanakan pengembangan dengan notebook Colab Enterprise berbasis AI, serta MLOps yang tangguh, yang didukung oleh AI terkemuka di industri.

Workspace terpusat dengan notebook yang mengutamakan AI

Pilih dari serangkaian solusi notebook untuk data science perusahaan. Colab Enterprise menawarkan lingkungan terkelola yang aman dan terintegrasi dengan Vertex AI dan BigQuery. Vertex AI Workbench menyediakan instance JupyterLab yang dapat disesuaikan, sedangkan Cloud Workstations mendukung IDE lengkap. Ekstensi juga menghubungkan alat yang dihosting sendiri secara langsung ke layanan Google Cloud.

Agen Data Science

Agen data science terintegrasi

Mempercepat pengembangan data science dengan kemampuan agentic yang memfasilitasi eksplorasi data, transformasi, dan pemodelan ML. Mulai dengan sasaran tingkat tinggi dalam bahasa Inggris sederhana, dan agen data science akan membuat rencana terperinci yang mencakup semua aspek pemodelan data science mulai dari pemuatan data, eksplorasi, pembersihan, visualisasi, rekayasa fitur, pemisahan data, pelatihan/pengoptimalan model, dan evaluasi.

Persiapan data yang dibantu AI tanpa silo

Manfaatkan fondasi data terpadu, yang mengelola data terstruktur dan tidak terstruktur (gambar, dokumen, dan lainnya) menggunakan SQL untuk analisis dan fungsi AI untuk pemrosesan. Persiapan data yang dibantu AI memberikan saran untuk pembersihan dan transformasi data. Agen Rekayasa Data mengotomatiskan tugas rekayasa data, termasuk penyerapan dan pembuatan pipeline, melalui petunjuk bahasa natural.

Agen Data Engineering
Dataproc Terkelola dan Serverless Spark

Pemrosesan data yang fleksibel dengan beberapa mesin

Pilih mesin pemrosesan apa pun, baik mesin SQL BigQuery atau framework open source seperti Apache Spark, untuk bekerja secara langsung pada satu salinan data yang terpadu. Dengan demikian, Anda tidak perlu mempertahankan salinan data terpisah untuk sistem yang berbeda.

Menskalakan data science dengan BigQuery DataFrames untuk Python

Lebih suka library berbasis Python? BigQuery DataFrames menyediakan API seperti pandas yang menerjemahkan kode Python ke dalam SQL yang dioptimalkan untuk dieksekusi di mesin BigQuery. Hal ini memberikan fleksibilitas untuk menggunakan alat yang tepat untuk tugas, baik SQL, PySpark, atau DataFrame bergaya pandas, semuanya sambil bekerja pada data dasar yang sama.

Video BigQuery DataFrames
BQML

Membangun, melatih, menyesuaikan, dan menjalankan model ML

Bangun, latih, evaluasi, dan deploy model dengan BigQuery ML menggunakan SQL, sehingga menghilangkan pergerakan data. Manfaatkan model bawaan yang telah terlatih sebelumnya, atau fungsi SQL yang memanggil Gemini untuk analisis/pengayaan data. Untuk model kustom, Vertex AI mendukung PyTorch, TensorFlow, dan library ML lainnya. Integrasi yang lancar memungkinkan rekayasa fitur di BigQuery, pelatihan model kustom di Vertex AI, dan inferensi kembali di BigQuery melalui SQL.

Membuat embeddings dan mengaktifkan penelusuran vektor

Membuat dan menggunakan embedding multimodal untuk melakukan penelusuran vektor, yang memungkinkan pemahaman semantik dan pengambilan data multimodal berbasis kemiripan. Hal ini memungkinkan Anda membangun penelusuran semantik, rekomendasi, atau sistem segmentasi yang canggih tanpa perlu mengelola database vektor khusus yang terpisah.

embeddings and penelusuran vektor

Beralih dari model ke produksi dengan MLOps terintegrasi

BigQuery dan Vertex AI terintegrasi untuk menyederhanakan "tahap akhir" MLOps. Pusatkan fitur di Vertex AI Feature Store untuk mencegah diferensiasi performa pelatihan dan penayangan serta pekerjaan yang berlebihan. Menggunakan Vertex AI AutoML untuk mengotomatiskan pembuatan model untuk data tabulasi. Semua model, baik dari BigQuery ML maupun Vertex AI, otomatis terdaftar di Vertex AI Model Registry. Dari sana, Anda dapat dengan mudah membuat versi, mengevaluasi, dan men-deploy model, sehingga menciptakan siklus proses end-to-end yang lancar di satu platform.