Seiring model AI generatif dan machine learning (ML) menjadi lebih umum dalam aktivitas bisnis dan proses bisnis perusahaan, perusahaan semakin membutuhkan panduan tentang pengembangan model untuk memastikan konsistensi, kemampuan berulang, keamanan, dan keselamatan. Untuk membantu perusahaan besar membangun dan men-deploy model AI generatif dan ML, kami membuat blueprint AI generatif dan machine learning perusahaan. Blueprint ini memberi Anda panduan komprehensif untuk seluruh siklus proses pengembangan AI, mulai dari eksplorasi dan eksperimen data awal hingga pelatihan, deployment, dan pemantauan model.
Blueprint ML dan AI generatif perusahaan memberi Anda banyak manfaat, termasuk yang berikut:
- Panduan preskriptif: Panduan yang jelas tentang cara membuat, mengonfigurasi, dan men-deploy lingkungan pengembangan AI generatif dan ML yang didasarkan pada Vertex AI. Anda dapat menggunakan Vertex AI untuk mengembangkan model Anda sendiri.
- Peningkatan efisiensi: Otomatisasi yang ekstensif untuk membantu mengurangi beban deployment infrastruktur dan pengembangan model AI dan ML generatif. Otomatisasi memungkinkan Anda berfokus pada tugas bernilai tambah seperti desain dan eksperimen model.
- Peningkatan tata kelola dan auditabilitas: Reproduksi, pelacakan, dan deployment model yang terkontrol disertakan dalam desain blueprint ini. Manfaat ini memungkinkan Anda mengelola siklus proses model AI dan ML generatif dengan lebih baik dan membantu memastikan Anda dapat melatih ulang dan mengevaluasi model secara konsisten, dengan jejak audit yang jelas.
- Keamanan: Blueprint dirancang agar selaras dengan persyaratan framework National Institute of Standards and Technology (NIST) dan framework Cyber Risk Institute (CRI).
Blueprint AI generatif dan ML perusahaan mencakup hal berikut:
- Repositori GitHub
yang berisi kumpulan konfigurasi Terraform, Jupyter notebook,
definisi
Vertex AI Pipelines, directed acyclic graph (DAG)
Cloud Composer, dan skrip tambahan. Komponen dalam repositori menyelesaikan hal berikut:
- Konfigurasi Terraform menyiapkan platform pengembangan model Vertex AI yang dapat mendukung beberapa tim pengembangan model.
- Notebook Jupyter memungkinkan Anda mengembangkan model secara interaktif.
- Definisi Vertex AI Pipelines menerjemahkan notebook Jupyter menjadi pola yang dapat direproduksi dan dapat digunakan untuk lingkungan produksi.
- DAG Cloud Composer menyediakan metode alternatif untuk Vertex AI Pipelines.
- Skrip tambahan membantu men-deploy kode dan pipeline Terraform.
- Panduan untuk arsitektur, desain, kontrol keamanan, dan proses operasional yang akan Anda terapkan menggunakan blueprint ini (dokumen ini).
Blueprint AI generatif dan ML perusahaan dirancang agar kompatibel dengan blueprint dasar-dasar perusahaan. Blueprint fondasi perusahaan menyediakan sejumlah layanan tingkat dasar yang menjadi andalan blueprint ini, seperti jaringan VPC. Anda dapat men-deploy blueprint AI dan ML generatif perusahaan tanpa men-deploy blueprint dasar-dasar perusahaan jika lingkungan Google Cloud Anda menyediakan fungsi yang diperlukan untuk mendukung blueprint AI dan ML generatif perusahaan.
Dokumen ini ditujukan untuk arsitek cloud, data scientist, dan engineer data yang dapat menggunakan blueprint untuk membuat dan men-deploy model AI atau ML generatif baru di Google Cloud. Dokumen ini mengasumsikan bahwa Anda sudah memahami pengembangan model ML dan AI generatif serta platform machine learning Vertex AI.
Ringkasan blueprint AI generatif dan ML perusahaan
Blueprint AI generatif dan ML perusahaan menggunakan pendekatan berlapis untuk memberikan kemampuan yang memungkinkan pelatihan model AI generatif dan ML. Blueprint ini ditujukan untuk di-deploy dan dikontrol melalui alur kerja operasi ML (MLOps). Diagram berikut menunjukkan bagaimana lapisan MLOps yang di-deploy oleh blueprint ini terkait dengan lapisan lain di lingkungan Anda.
Diagram ini mencakup hal berikut:
- Infrastruktur Google Cloud menyediakan kemampuan keamanan seperti enkripsi dalam penyimpanan dan enkripsi dalam pengiriman, serta elemen penyusun dasar seperti komputasi dan penyimpanan.
- Foundation perusahaan memberi Anda dasar pengukuran resource seperti sistem identitas, jaringan, logging, pemantauan, dan deployment yang memungkinkan Anda mengadopsi Google Cloud untuk workload AI.
- Lapisan data adalah lapisan opsional dalam stack pengembangan yang memberi Anda berbagai kemampuan seperti penyerapan data, penyimpanan data, kontrol akses data, tata kelola data, pemantauan data, dan berbagi data.
- Lapisan AI generatif dan ML (blueprint ini) memungkinkan Anda mem-build dan men-deploy model. Anda dapat menggunakan lapisan ini untuk eksplorasi dan eksperimen data awal, pelatihan model, penayangan model, dan pemantauan.
- CI/CD menyediakan alat untuk mengotomatiskan penyediaan, konfigurasi, pengelolaan, dan deployment infrastruktur, alur kerja, dan komponen software. Komponen ini membantu Anda memastikan deployment yang konsisten, andal, dan dapat diaudit; meminimalkan error manual; dan mempercepat siklus pengembangan secara keseluruhan.
Untuk menunjukkan cara penggunaan lingkungan AI dan ML generatif, blueprint ini menyertakan contoh pengembangan model ML. Pengembangan model contoh akan memandu Anda dalam mem-build model, membuat pipeline operasional, melatih model, menguji model, dan men-deploy model.
Arsitektur
Blueprint AI generatif dan ML perusahaan memberi Anda kemampuan untuk bekerja langsung dengan data. Anda dapat membuat model di lingkungan interaktif (pengembangan) dan mempromosikan model ke lingkungan operasional (produksi atau non-produksi).
Di lingkungan interaktif, Anda mengembangkan model ML menggunakan Vertex AI Workbench, yang merupakan layanan Jupyter Notebook yang dikelola oleh Google. Anda akan membuat kemampuan ekstraksi data, transformasi data, dan penyesuaian model di lingkungan interaktif dan mempromosikannya ke lingkungan operasional.
Di lingkungan operasional (non-produksi), Anda menggunakan pipeline untuk mem-build dan menguji modelnya dengan cara yang dapat diulang dan terkontrol. Setelah merasa puas dengan performa model, Anda dapat men-deploy model ke lingkungan operasional (produksi). Diagram berikut menunjukkan berbagai komponen lingkungan interaktif dan operasional.
Diagram ini mencakup hal berikut:
- Sistem deployment: Layanan seperti Service Catalog dan Cloud Build men-deploy resource Google Cloud ke lingkungan interaktif. Cloud Build juga men-deploy resource Google Cloud dan alur kerja pembuatan model ke lingkungan operasional.
- Sumber data: Layanan seperti BigQuery, Cloud Storage, Spanner, dan AlloyDB untuk PostgreSQL menghosting data Anda. Blueprint ini memberikan contoh data di BigQuery dan Cloud Storage.
- Lingkungan interaktif: Lingkungan tempat Anda dapat berinteraksi secara langsung dengan data, bereksperimen dengan model, dan membuat pipeline untuk digunakan di lingkungan operasional.
- Lingkungan operasional: Lingkungan tempat Anda dapat mem-build dan menguji model dengan cara yang dapat diulang, lalu men-deploy model ke produksi.
- Layanan model: Layanan berikut mendukung berbagai aktivitas MLOps:
- Vertex AI Feature Store menayangkan data fitur ke model Anda.
- Model Garden menyertakan library model ML yang memungkinkan Anda menggunakan model Google dan memilih model open source.
- Vertex AI Model Registry mengelola siklus proses model ML Anda.
- Penyimpanan artefak: Layanan ini menyimpan kode dan penampung serta
untuk pengembangan dan pipeline model Anda. Layanan ini mencakup hal berikut:
- Artifact Registry menyimpan penampung yang digunakan oleh pipeline di lingkungan operasional untuk mengontrol berbagai tahap pengembangan model.
- Repositori Git menyimpan codebase dari berbagai komponen yang digunakan dalam pengembangan model.
Persona platform
Saat men-deploy blueprint, Anda akan membuat empat jenis grup pengguna: grup engineer MLOps, grup engineer DevOps, grup data scientist, dan grup engineer data. Grup tersebut memiliki tanggung jawab berikut:
- Grup MLOps engineer mengembangkan template Terraform yang digunakan oleh Katalog Layanan. Tim ini menyediakan template yang digunakan oleh banyak model.
- Grup DevOps engineer menyetujui template Terraform yang dibuat oleh grup developer MLOps.
- Grup data scientist mengembangkan model, pipeline, dan penampung yang digunakan oleh pipeline. Biasanya, satu tim disediakan untuk membuat satu model.
- Grup Data engineer menyetujui penggunaan artefak yang dibuat oleh grup ilmu data.
Struktur organisasi
Blueprint ini menggunakan struktur organisasi blueprint fondasi perusahaan sebagai dasar untuk men-deploy workload AI dan ML. Diagram berikut menunjukkan project yang ditambahkan ke foundation untuk mengaktifkan workload AI dan ML.
Tabel berikut menjelaskan project yang digunakan oleh blueprint AI generatif dan ML.
Folder | Project | Deskripsi |
---|---|---|
|
|
Berisi pipeline deployment yang digunakan untuk mem-build komponen AI generatif dan ML dari blueprint. Untuk mengetahui informasi selengkapnya, lihat pipeline infrastruktur dalam blueprint fondasi perusahaan. |
|
Berisi infrastruktur yang digunakan oleh Service Catalog untuk men-deploy resource di lingkungan interaktif. | |
|
|
Berisi komponen untuk mengembangkan kasus penggunaan AI dan ML dalam mode interaktif. |
|
|
Berisi komponen untuk menguji dan mengevaluasi kasus penggunaan AI dan ML yang dapat di-deploy ke produksi. |
|
|
Berisi komponen untuk men-deploy kasus penggunaan AI dan ML ke produksi. |
Jaringan
Blueprint ini menggunakan jaringan VPC Bersama yang dibuat dalam blueprint fondasi perusahaan. Di lingkungan interaktif (pengembangan), notebook Vertex AI Workbench di-deploy dalam project layanan. Pengguna lokal dapat mengakses project menggunakan ruang alamat IP pribadi di jaringan VPC Bersama. Pengguna lokal dapat mengakses Google Cloud API, seperti Cloud Storage, melalui Private Service Connect. Setiap jaringan VPC Bersama (pengembangan, non-produksi, dan produksi) memiliki endpoint Private Service Connect yang berbeda.
Lingkungan operasional (non-produksi dan produksi) memiliki dua jaringan VPC Bersama terpisah yang dapat diakses oleh resource lokal melalui alamat IP pribadi. Lingkungan interaktif dan operasional dilindungi menggunakan Kontrol Layanan VPC.
Cloud Logging
Blueprint ini menggunakan kemampuan Cloud Logging yang disediakan oleh blueprint dasar-dasar perusahaan.
Cloud Monitoring
Untuk memantau tugas pelatihan kustom, blueprint menyertakan dasbor yang memungkinkan Anda memantau metrik berikut:
- Penggunaan CPU setiap node pelatihan
- Penggunaan memori setiap node pelatihan
- Penggunaan jaringan
Jika tugas pelatihan kustom gagal, blueprint akan menggunakan Cloud Monitoring untuk memberikan mekanisme pemberitahuan email kepada Anda untuk memberi tahu Anda tentang kegagalan tersebut. Untuk memantau model yang di-deploy yang menggunakan endpoint Vertex AI, blueprint dilengkapi dengan dasbor yang memiliki metrik berikut:
- Metrik performa:
- Prediksi per detik
- Latensi model
- Penggunaan resource:
- Penggunaan CPU
- Penggunaan memori
Penyiapan kebijakan organisasi
Selain kebijakan organisasi yang dibuat oleh blueprint fondasi perusahaan, blueprint ini menambahkan kebijakan organisasi yang tercantum dalam postur yang telah ditentukan sebelumnya untuk AI yang aman, diperluas.
Operasi
Bagian ini menjelaskan lingkungan yang disertakan dalam blueprint.
Lingkungan interaktif
Agar Anda dapat menjelajahi data dan mengembangkan model sekaligus mempertahankan postur keamanan organisasi, lingkungan interaktif menyediakan kumpulan tindakan terkontrol yang dapat Anda lakukan. Anda dapat men-deploy resource Google Cloud menggunakan salah satu metode berikut:
- Menggunakan Katalog Layanan, yang telah dikonfigurasi sebelumnya melalui otomatisasi dengan template resource
- Mem-build artefak kode dan melakukan commit ke repositori Git menggunakan notebook Vertex AI Workbench
Diagram berikut menggambarkan lingkungan interaktif.
Flow interaktif standar memiliki langkah dan komponen berikut yang terkait dengannya:
- Katalog Layanan menyediakan daftar resource Google Cloud yang diseleksi dan dapat di-deploy oleh data scientist ke lingkungan interaktif. Data scientist men-deploy resource notebook Vertex AI Workbench dari Service Catalog.
- Notebook Vertex AI Workbench adalah antarmuka utama yang digunakan data scientist untuk menggunakan resource Google Cloud yang di-deploy di lingkungan interaktif. Notebook memungkinkan ilmuwan data mengambil kode dari Git dan memperbarui kode sesuai kebutuhan.
- Data sumber disimpan di luar lingkungan interaktif dan dikelola secara terpisah dari blueprint ini. Akses ke data dikontrol oleh pemilik data. Ilmuwan data dapat meminta akses baca ke data sumber, tetapi ilmuwan data tidak dapat menulis ke data sumber.
- Ilmuwan data dapat mentransfer data sumber ke lingkungan interaktive menjadi resource yang dibuat melalui Katalog Layanan. Dalam lingkungan interaktif, data scientist dapat membaca, menulis, dan memanipulasi data. Namun, ilmuwan data tidak dapat mentransfer data keluar dari lingkungan interaktif atau memberikan akses ke resource yang dibuat oleh Service Catalog. BigQuery menyimpan data terstruktur dan data semi-terstruktur, sedangkan Cloud Storage menyimpan data tidak terstruktur.
- Feature Store memberi data scientist akses latensi rendah ke fitur untuk pelatihan model.
Data scientist melatih model menggunakan tugas pelatihan kustom Vertex AI. Blueprint ini juga menggunakan Vertex AI untuk penyesuaian hyperparameter.
Data scientist mengevaluasi model melalui penggunaan Eksperimen Vertex AI dan TensorBoard Vertex AI. Vertex AI Experiments memungkinkan Anda menjalankan beberapa pelatihan terhadap model menggunakan parameter, teknik pemodelan, arsitektur, dan input yang berbeda. Vertex AI TensorBoard memungkinkan Anda melacak, memvisualisasikan, dan membandingkan berbagai eksperimen yang Anda jalankan, lalu memilih model dengan karakteristik pengamatan terbaik untuk divalidasi.
Data scientist memvalidasi model mereka dengan evaluasi Vertex AI. Untuk memvalidasi model mereka, data scientist membagi data sumber menjadi set data pelatihan dan set data validasi, lalu menjalankan evaluasi Vertex AI terhadap model Anda.
Ilmuwan data mem-build container menggunakan Cloud Build, menyimpan container di Artifact Registry, dan menggunakan container dalam pipeline yang berada di lingkungan operasional.
Lingkungan operasional
Lingkungan operasional menggunakan repositori dan pipeline Git. Lingkungan ini mencakup lingkungan produksi dan lingkungan non-produksi dari blueprint fondasi perusahaan. Di lingkungan non-produksi, ilmuwan data memilih pipeline dari salah satu pipeline yang dikembangkan di lingkungan interaktif. Data scientist dapat menjalankan pipeline di lingkungan non-produksi, mengevaluasi hasilnya, lalu menentukan model mana yang akan dipromosikan ke lingkungan produksi.
Blueprint ini mencakup contoh pipeline yang dibuat menggunakan Cloud Composer dan contoh pipeline yang dibuat menggunakan Vertex AI Pipelines. Diagram di bawah menunjukkan lingkungan operasional.
Alur operasional standar memiliki langkah-langkah berikut:
- Seorang data scientist berhasil menggabungkan cabang pengembangan ke dalam cabang deployment.
- Penggabungan ke cabang deployment memicu pipeline Cloud Build.
- Salah satu item berikut terjadi:
- Jika ilmuwan data menggunakan Cloud Composer sebagai orkestrator, pipeline Cloud Build akan memindahkan DAG ke Cloud Storage.
- Jika data scientist menggunakan Vertex AI Pipelines sebagai orkestrator, pipeline akan memindahkan file Python ke Cloud Storage.
- Pipeline Cloud Build memicu orkestrator (Cloud Composer atau Vertex AI Pipelines).
- Orkestrator mengambil definisi pipeline-nya dari Cloud Storage dan mulai mengeksekusi pipeline.
- Pipeline menarik container dari Artifact Registry yang digunakan oleh semua tahap pipeline untuk memicu layanan Vertex AI.
- Pipeline, yang menggunakan penampung, memicu transfer data dari project data sumber ke lingkungan operasional.
- Data ditransformasikan, divalidasi, dibagi, dan disiapkan untuk pelatihan dan validasi model oleh pipeline.
- Jika diperlukan, pipeline akan memindahkan data ke Vertex AI Feature Store untuk memudahkan akses selama pelatihan model.
- Pipeline menggunakan pelatihan model kustom Vertex AI untuk melatih model.
- Pipeline menggunakan evaluasi Vertex AI untuk memvalidasi model.
- Model yang divalidasi diimpor ke dalam Model Registry oleh pipeline.
- Model yang diimpor kemudian digunakan untuk menghasilkan prediksi melalui prediksi online atau prediksi batch.
- Setelah model di-deploy ke lingkungan produksi, pipeline menggunakan Vertex AI Model Monitoring untuk mendeteksi apakah performa model menurun dengan memantau diferensiasi performa pelatihan dan penayangan dan penyimpangan prediksi.
Deployment
Blueprint menggunakan serangkaian pipeline Cloud Build untuk menyediakan infrastruktur blueprint, pipeline di lingkungan operasional, dan container yang digunakan untuk membuat model AI dan ML generatif. Pipeline yang digunakan dan resource yang disediakan adalah sebagai berikut:
- Pipeline infrastruktur: Pipeline ini adalah bagian dari blueprint fondasi perusahaan. Pipeline ini menyediakan resource Google Cloud yang terkait dengan lingkungan interaktif dan lingkungan operasional.
- Pipeline interaktif: Pipeline interaktif adalah bagian dari lingkungan interaktif. Pipeline ini menyalin template Terraform dari repositori Git ke bucket Cloud Storage yang dapat dibaca oleh Service Catalog. Pipeline interaktif dipicu saat permintaan pull dibuat untuk digabungkan dengan cabang utama.
- Pipeline container: Blueprint menyertakan pipeline Cloud Build untuk mem-build container yang digunakan dalam pipeline operasional. Container yang di-deploy di seluruh lingkungan adalah image container yang tidak dapat diubah. Image container yang tidak dapat diubah membantu memastikan bahwa image yang sama di-deploy di semua lingkungan dan tidak dapat diubah saat sedang berjalan. Jika perlu mengubah aplikasi, Anda harus mem-build ulang dan men-deploy ulang image. Image container yang digunakan dalam blueprint disimpan di Artifact Registry dan dirujuk oleh file konfigurasi yang digunakan dalam pipeline operasional.
- Pipeline operasional: Pipeline operasional adalah bagian dari lingkungan operasional. Pipeline ini menyalin DAG untuk Cloud Composer atau Vertex AI Pipelines, yang kemudian digunakan untuk mem-build, menguji, dan men-deploy model.
Katalog Layanan
Dengan Katalog Layanan, developer dan administrator cloud dapat membuat solusi mereka dapat digunakan oleh pengguna versi bisnis internal. Modul Terraform di Katalog Layanan di-build dan dipublikasikan sebagai artefak ke bucket Cloud Storage dengan pipeline CI/CD Cloud Build. Setelah modul disalin ke bucket, developer dapat menggunakan modul tersebut untuk membuat solusi Terraform di halaman Admin Katalog Layanan, menambahkan solusi ke Katalog Layanan, dan membagikan solusi tersebut dengan project lingkungan interaktif sehingga pengguna dapat men-deploy resource.
Lingkungan interaktif menggunakan Service Catalog untuk memungkinkan data scientist men-deploy resource Google Cloud dengan cara yang mematuhi postur keamanan perusahaan mereka. Saat mengembangkan model yang memerlukan resource Google Cloud, seperti bucket Cloud Storage, data scientist memilih resource dari Katalog Layanan, mengonfigurasi resource, dan men-deploy resource di lingkungan interaktif. Service Catalog berisi template yang telah dikonfigurasi sebelumnya untuk berbagai resource Google Cloud yang dapat di-deploy oleh ilmuwan data di lingkungan interaktif. Ilmuwan data tidak dapat mengubah template resource, tetapi dapat mengonfigurasi resource melalui variabel konfigurasi yang ditampilkan template. Diagram berikut menunjukkan struktur cara Katalog Layanan dan lingkungan interaktif saling berhubungan.
Ilmuwan data men-deploy resource menggunakan Service Catalog, seperti yang dijelaskan dalam langkah-langkah berikut:
- Engineer MLOps menempatkan template resource Terraform untuk Google Cloud ke dalam repositori Git.
- Commit ke Git memicu pipeline Cloud Build.
- Cloud Build menyalin template dan file konfigurasi terkait ke Cloud Storage.
- Engineer MLOps menyiapkan solusi Katalog Layanan dan Katalog Layanan secara manual. Engineer kemudian membagikan Katalog Layanan dengan project layanan di lingkungan interaktif.
- Data scientist memilih resource dari Service Catalog.
- Katalog Layanan men-deploy template ke lingkungan interaktif.
- Resource ini mengambil skrip konfigurasi yang diperlukan.
- Data scientist berinteraksi dengan resource.
Repositori
Pipeline yang dijelaskan dalam Deployment dipicu oleh perubahan dalam repositori yang sesuai. Untuk membantu memastikan bahwa tidak ada yang dapat melakukan perubahan independen pada lingkungan produksi, ada pemisahan tanggung jawab antara pengguna yang dapat mengirimkan kode dan pengguna yang dapat menyetujui perubahan kode. Tabel berikut menjelaskan repositori blueprint serta pengirim dan pemberi persetujuannya.
Repositori | Pipeline | Deskripsi | Pengirim | Pemberi Persetujuan |
---|---|---|---|---|
|
Infrastruktur |
Berisi kode Terraform untuk blueprint AI dan ML generatif yang membuat lingkungan interaktif dan operasional. | MLOps engineer | DevOps engineer |
|
Interaktif | Berisi template untuk resource yang dapat di-deploy oleh Service Catalog. | MLOps engineer | DevOps engineer |
|
Container | Berisi penampung yang dapat digunakan pipeline di lingkungan operasional. | Ilmuwan data | Data engineer |
|
Operasional | Berisi kode sumber yang dapat digunakan pipeline di lingkungan operasional. | Ilmuwan data | Data engineer |
Strategi cabang
Blueprint ini menggunakan cabang persisten untuk men-deploy kode ke lingkungan terkait. Blueprint menggunakan tiga cabang (pengembangan, non-produksi, dan produksi) yang mencerminkan lingkungan yang sesuai.
Kontrol keamanan
Blueprint AI dan ML generatif perusahaan menggunakan model keamanan defense-in-depth berlapis yang menggunakan kemampuan Google Cloud default, layanan Google Cloud, dan kemampuan keamanan yang dikonfigurasi melalui blueprint fondasi perusahaan. Diagram berikut menunjukkan lapisan berbagai kontrol keamanan untuk blueprint.
Fungsi lapisan adalah sebagai berikut:
- Antarmuka: menyediakan layanan bagi data scientist yang memungkinkan mereka berinteraksi dengan blueprint dengan cara yang terkontrol.
- Deployment: menyediakan serangkaian pipeline yang men-deploy infrastruktur, mem-build container, dan membuat model. Penggunaan pipeline memungkinkan audit, keterlacakan, dan pengulangan.
- Jaringan: memberikan perlindungan terhadap pemindahan data yang tidak sah di sekitar resource blueprint di lapisan API dan lapisan IP.
- Pengelolaan akses: mengontrol siapa yang dapat mengakses resource apa dan membantu mencegah penggunaan resource Anda yang tidak sah.
- Enkripsi: memungkinkan Anda mengontrol kunci enkripsi, secret, dan membantu melindungi data Anda melalui enkripsi dalam penyimpanan dan enkripsi dalam transit default.
- Detektif: membantu Anda mendeteksi kesalahan konfigurasi dan aktivitas berbahaya.
- Preventif: memberi Anda cara untuk mengontrol dan membatasi cara deployment infrastruktur.
Tabel berikut menjelaskan kontrol keamanan yang terkait dengan setiap lapisan.
Lapisan. | Resource | Kontrol keamanan |
---|---|---|
Antarmuka | Vertex AI Workbench | Memberikan pengalaman notebook terkelola yang menggabungkan kontrol akses pengguna, kontrol akses jaringan, kontrol akses IAM, dan download file yang dinonaktifkan. Fitur ini memungkinkan pengalaman pengguna yang lebih aman. |
Repositori Git | Memberikan kontrol akses pengguna untuk melindungi repositori Anda. | |
Katalog Layanan | Memberikan daftar resource pilihan kepada data scientist yang hanya dapat di-deploy dalam konfigurasi yang disetujui. | |
Deployment | Pipeline infrastruktur | Memberikan alur yang aman untuk men-deploy infrastruktur blueprint melalui penggunaan Terraform. |
Pipeline interaktif | Memberikan alur yang aman untuk mentransfer template dari repositori Git ke bucket dalam organisasi Google Cloud Anda. | |
Pipeline penampung | Memberikan alur yang aman untuk mem-build container yang digunakan oleh pipeline operasional. | |
Pipeline operasional | Memberikan alur terkontrol untuk melatih, menguji, memvalidasi, dan men-deploy model. | |
Artifact Registry | Menyimpan image container dengan aman menggunakan kontrol akses resource | |
Jaringan | Private Service Connect | Memungkinkan Anda berkomunikasi dengan Google Cloud API menggunakan alamat IP pribadi sehingga Anda dapat menghindari eksposur traffic ke internet. |
VPC dengan alamat IP pribadi | Blueprint ini menggunakan VPC dengan alamat IP pribadi untuk membantu menghilangkan eksposur terhadap ancaman yang dihadapi internet. | |
Kontrol Layanan VPC | Membantu melindungi resource yang dilindungi dari pemindahan data yang tidak sah. | |
Firewall | Membantu melindungi jaringan VPC dari akses yang tidak sah. | |
Pengelolaan Akses | Cloud Identity | Memberikan pengelolaan pengguna terpusat, sehingga mengurangi risiko akses tanpa izin. |
IAM | Memberikan kontrol terperinci tentang siapa yang dapat melakukan apa pada resource mana, sehingga memungkinkan hak istimewa terendah dalam pengelolaan akses. | |
Enkripsi | Cloud KMS | Memungkinkan Anda mengontrol kunci enkripsi yang digunakan dalam organisasi Google Cloud Anda. |
Secret Manager | Menyediakan secret store untuk model Anda yang dikontrol oleh IAM. | |
Enkripsi dalam penyimpanan | Secara default, Google Cloud mengenkripsi data dalam penyimpanan. | |
Enkripsi saat transit | Secara default, Google Cloud mengenkripsi data dalam pengiriman. | |
Detektif | Security Command Center | Menyediakan pendeteksi ancaman yang membantu melindungi organisasi Google Cloud Anda. |
Arsitektur berkelanjutan | Terus memeriksa organisasi Google Cloud Anda terhadap serangkaian kebijakan Open Policy Agent (OPA) yang telah Anda tentukan. | |
Pemberi Rekomendasi IAM | Menganalisis izin pengguna dan memberikan saran tentang cara mengurangi izin untuk membantu menerapkan prinsip hak istimewa terendah. | |
Analisis Firewall | Menganalisis aturan firewall, mengidentifikasi aturan firewall yang terlalu permisif, dan menyarankan firewall yang lebih ketat untuk membantu memperkuat postur keamanan Anda secara keseluruhan. | |
Cloud Logging | Memberikan visibilitas ke aktivitas sistem dan membantu mengaktifkan deteksi anomali dan aktivitas berbahaya. | |
Cloud Monitoring | Melacak sinyal dan peristiwa utama yang dapat membantu mengidentifikasi aktivitas yang mencurigakan. | |
Pencegahan | Organization Policy Service | Memungkinkan Anda membatasi tindakan dalam organisasi Google Cloud Anda. |
Langkah selanjutnya
- Deploy Terraform yang terkait dengan blueprint ini.
- Pelajari lebih lanjut cetak biru fondasi perusahaan.
- Baca Praktik terbaik untuk menerapkan machine learning di Google Cloud.
- Pelajari Vertex AI lebih lanjut.
- Pelajari MLOps di Google Cloud lebih lanjut:
- MLOps di Vertex AI
- Panduan praktisi untuk MLOps: Framework untuk continuous delivery dan otomatisasi machine learning (PDF)
- MLOps: Pipeline otomatisasi dan continuous delivery di machine learning
- Arsitektur untuk MLOps menggunakan TensorFlow Extended, Vertex AI Pipelines, dan Cloud Build
- Kode contoh Vertex AI Pipelines
- Kode contoh notebook Vertex AI
- Untuk mengetahui lebih banyak tentang arsitektur referensi, diagram, dan praktik terbaik lainnya, jelajahi Pusat Arsitektur Cloud.