Melacak silsilah artefak pipeline

Setiap pipeline yang dijalankan menggunakan Vertex AI Pipelines memiliki beberapa artefak dan parameter terkait, seperti model, set data, template pipeline, dan komponen. Silsilah artefak pipeline mencakup faktor yang berkontribusi pada pembuatannya, serta artefak dan metadata yang berasal dari artefak tersebut. Misalnya, silsilah model dapat mencakup hal berikut:

  • Data pelatihan, pengujian, dan evaluasi yang digunakan untuk membuat model.

  • Hyperparameter yang digunakan selama pelatihan model.

  • Metadata yang direkam dari proses pelatihan dan evaluasi, seperti akurasi model.

  • Artefak yang menurun dari model ini, seperti hasil prediksi batch.

Anda dapat menggunakan metadata ini untuk membantu menjawab pertanyaan seperti berikut:

  • Mengapa operasi pipeline tertentu menghasilkan model yang sangat akurat?

  • Operasi pipeline mana yang menghasilkan model paling akurat, dan hyperparameter apa yang digunakan untuk melatih model tersebut?

  • Bergantung pada langkah-langkah dalam pipeline, Anda mungkin dapat menjawab pertanyaan tata kelola sistem. Misalnya, Anda dapat menggunakan metadata untuk menentukan versi model mana yang diproduksi pada waktu tertentu.

Untuk melihat dan menganalisis silsilah artefak pipeline, Anda dapat menggunakan Metadata Vertex ML atau Dataplex.

Tabel berikut menguraikan perbedaan antara Metadata Vertex ML dan Dataplex:

Fitur Vertex ML Metadata Dataplex
Jenis metadata pipeline yang diambil Semua artefak input dan output yang dihasilkan oleh proses pipeline. Artefak input dan output yang dapat dipetakan ke nama yang sepenuhnya memenuhi syarat (FQN) yang didukung oleh Dataplex, umumnya menggunakan Komponen Pipeline Google Cloud
Geografi Pembacaan region tunggal. Pembacaan global, yaitu di beberapa region.
Project Pembacaan project tunggal. Pembacaan seluruh organisasi di beberapa project.
Layanan terintegrasi Terintegrasi dengan Vertex AI Pipelines, Vertex AI Experiments, Vertex AI Model Registry, dan Datasets Terintegrasi dengan berbagai produk Google Cloud, seperti Vertex AI, BigQuery, Cloud Composer, dan Dataproc.
Ikut serta? Tidak, selalu aktif. Penyertaan diperlukan untuk setiap penyimpanan metadata ML.

Memetakan artefak Metadata Vertex ML ke Dataplex

Untuk memetakan artefak Metadata Vertex ML ke FQN di Dataplex, Anda harus melakukan hal berikut:

  • Gunakan Komponen Pipeline Google Cloud saat membuat model Vertex AI dan set data terkelola.

  • Gunakan judul skema kustom (google.VertexDataset atau google.VertexModel) saat menentukan model atau nama resource set data terkelola di kolom metadata, seperti yang diilustrasikan dalam contoh berikut:

{
  "name": "projects/example-project/locations/us-central1/metadataStores/default/artifacts/example-artifact",
  "displayName": "My dataset",
  "uri": "https://us-central1-aiplatform.googleapis.com/v1/projects/example-project/locations/us-central1/datasets/example-dataset",
   ...
  "schemaTitle": "google.VertexDataset",
  "schemaVersion": "0.0.1",
  "metadata": {
    "resourceName": "projects/example-project/locations/us-central1/datasets/example-dataset"
  }
}

Melihat grafik silsilah untuk artefak pipeline

Menganalisis silsilah artefak pipeline menggunakan Metadata Vertex ML

Saat Anda menjalankan pipeline menggunakan Vertex AI Pipelines, artefak dan parameter dari pipeline yang dijalankan akan disimpan menggunakan Vertex ML Metadata. Vertex ML Metadata memudahkan analisis silsilah artefak pipeline Anda, dengan memudahkan Anda melacak metadata pipeline Anda.

Jika Anda baru mengenal Metadata Vertex ML, baca pengantar Metadata Vertex ML.

Ikuti petunjuk berikut untuk melihat grafik silsilah untuk artefak pipeline menggunakan Vertex ML Metadata:

  1. Di Konsol Google Cloud, di bagian Vertex AI, buka halaman Metadata.

    Buka Metadata

    Halaman Metadata mencantumkan artefak yang telah dibuat di penyimpanan metadata default.

  2. Di menu drop-down Region, pilih region tempat proses Anda dibuat.

  3. Klik Display name artefak untuk melihat grafik silsilahnya.

    Grafik statis yang menunjukkan artefak dan eksekusi yang merupakan bagian dari grafik silsilah ini akan muncul.

  4. Klik artefak atau eksekusi untuk mempelajarinya lebih lanjut.

Menganalisis silsilah artefak pipeline menggunakan Dataplex

Dataplex Data Catalog menemukan metadata dari resource Google Cloud, yang mencakup artefak Vertex AI Pipelines seperti model Vertex AI, set data terkelola, dan resource Google Cloud lainnya yang dapat ditemukan di Data Catalog. Anda dapat menemukan artefak ini menggunakan kemampuan penelusuran metadata Data Catalog dan melihat grafik silsilahnya.

Untuk informasi selengkapnya tentang kemampuan penelusuran metadata Data Catalog, lihat Menelusuri dan melihat aset data dengan Data Catalog.

Ikuti petunjuk berikut untuk melihat grafik silsilah untuk artefak pipeline di Dataplex:

  1. Untuk meluncurkan kueri penelusuran Dataplex di Konsol Google Cloud, buka halaman Dataplex Search.

    Buka Dataplex Search

  2. Gunakan filter untuk menelusuri artefak. Misalnya, Anda dapat menggunakan filter Data types untuk menentukan jenis artefak, seperti model, set data, atau tabel BigQuery. Untuk informasi selengkapnya tentang penelusuran Data Catalog, lihat Menelusuri aset data

    Anda juga dapat menentukan kueri di kolom penelusuran.

  3. Untuk melihat silsilah artefak, klik nama artefak, lalu klik tab Lineage.

    Pada grafik silsilah, proses Vertex AI didahului oleh Ikon silsilah Vertex AI. Hal ini termasuk artefak pipeline, komponen pipeline, dan template pipeline.

    • Untuk melihat detail proses, klik proses dalam grafik silsilah.

    • Untuk proses yang didasarkan pada tugas pipeline dari operasi pipeline, Anda dapat melakukan hal berikut:

      • Lihat proses pipeline di Vertex AI dengan mengklik Buka di Vertex AI di tab Detail. Untuk melihat detail runtime dari operasi pipeline, seperti status, stempel waktu, dan atribut, klik Lainnya. Untuk melihat pipeline yang dijalankan di Vertex AI, klik Open in Vertex AI.
    • Untuk proses berdasarkan template pipeline, Anda dapat melakukan hal berikut:

      • Lihat detail template di Vertex AI dengan mengklik Open in Vertex AI di tab Details.

      • Lihat daftar tugas pipeline yang dibuat dalam operasi pipeline di tab Runs. Untuk melihat detail template pipeline di Vertex AI, klik More, lalu klik Open in Vertex AI.

Langkah selanjutnya