Melacak silsilah artefak pipeline

Setiap proses pipeline yang dibuat menggunakan Vertex AI Pipelines memiliki beberapa artefak dan parameter terkait, seperti model, set data, template pipeline, dan komponen. Silsilah artefak pipeline mencakup faktor-faktor yang berkontribusi pada pembuatannya, serta artefak dan metadata yang berasal dari artefak. Misalnya, silsilah model dapat mencakup hal berikut:

  • Data pelatihan, pengujian, dan evaluasi yang digunakan untuk membuat model.

  • Hyperparameter yang digunakan selama pelatihan model.

  • Metadata yang direkam dari proses pelatihan dan evaluasi, seperti akurasi model.

  • Artefak yang diturunkan dari model ini, seperti hasil prediksi batch.

Anda dapat menggunakan metadata ini untuk membantu menjawab pertanyaan seperti berikut:

  • Mengapa operasi pipeline tertentu menghasilkan model yang sangat akurat?

  • Operasi pipeline mana yang menghasilkan model yang paling akurat, dan hyperparameter apa yang digunakan untuk melatih model tersebut?

  • Bergantung pada langkah-langkah dalam pipeline, Anda mungkin dapat menjawab pertanyaan tata kelola sistem. Misalnya, Anda dapat menggunakan metadata untuk menentukan versi model yang diproduksi pada waktu tertentu.

Untuk melihat dan menganalisis silsilah artefak pipeline, Anda dapat menggunakan Metadata Vertex ML atau Dataplex.

Tabel berikut menguraikan perbedaan antara Metadata Vertex ML dan Dataplex:

Fitur Vertex ML Metadata Dataplex
Jenis metadata pipeline yang direkam Semua artefak input dan output yang dihasilkan oleh operasi pipeline. Artefak input dan output yang dapat dipetakan ke nama yang sepenuhnya memenuhi syarat (FQN) yang didukung oleh Dataplex, umumnya menggunakan Komponen Pipeline Google Cloud
Geografi Pembacaan region tunggal. Pembacaan global, yaitu, di beberapa region.
Project Pembacaan satu project. Pembacaan seluruh organisasi di beberapa project.
Layanan terintegrasi Terintegrasi dengan Pipeline Vertex AI, Eksperimen Vertex AI, Vertex AI Model Registry, dan Set data Terintegrasi dengan beberapa produk Google Cloud, seperti Vertex AI, BigQuery, Cloud Composer, dan Dataproc.
Ikut serta? Tidak, selalu aktif. Keikutsertaan diperlukan untuk setiap penyimpanan metadata ML.

Memetakan artefak Metadata Vertex ML ke Dataplex

Untuk memetakan artefak Vertex ML Metadata ke FQN di Dataplex, Anda perlu melakukan tindakan berikut:

  • Menggunakan Komponen Pipeline Google Cloud saat membuat model Vertex AI dan set data terkelola.

  • Gunakan judul skema kustom (google.VertexDataset atau google.VertexModel) saat menentukan model atau nama resource set data terkelola di kolom metadata, seperti yang digambarkan dalam contoh berikut:

{
  "name": "projects/example-project/locations/us-central1/metadataStores/default/artifacts/example-artifact",
  "displayName": "My dataset",
  "uri": "https://us-central1-aiplatform.googleapis.com/v1/projects/example-project/locations/us-central1/datasets/example-dataset",
   ...
  "schemaTitle": "google.VertexDataset",
  "schemaVersion": "0.0.1",
  "metadata": {
    "resourceName": "projects/example-project/locations/us-central1/datasets/example-dataset"
  }
}

Menganalisis silsilah artefak pipeline menggunakan Metadata Vertex ML

Saat Anda menjalankan pipeline menggunakan Vertex AI Pipelines, artefak dan parameter dari pipeline yang dijalankan akan disimpan menggunakan Vertex ML Metadata. Vertex ML Metadata memudahkan analisis silsilah artefak pipeline Anda, dengan memudahkan Anda melacak metadata pipeline Anda.

Jika Anda baru mengenal Vertex ML Metadata, baca pengantar Vertex ML Metadata.

Ikuti petunjuk berikut guna melihat grafik silsilah untuk artefak pipeline menggunakan Metadata Vertex ML:

  1. Di Konsol Google Cloud, di bagian Vertex AI, buka halaman Metadata.

    Buka Metadata

    Halaman Metadata mencantumkan artefak yang telah dibuat di penyimpanan metadata default.

  2. Di menu drop-down Region, pilih region tempat proses Anda dibuat.

  3. Klik Display name artefak untuk melihat grafik silsilahnya.

    Grafik statis yang menunjukkan artefak dan eksekusi yang merupakan bagian dari grafik silsilah ini akan muncul.

  4. Klik artefak atau eksekusi untuk mempelajarinya lebih lanjut.

Menganalisis silsilah artefak pipeline menggunakan Dataplex

Dataplex Data Catalog menemukan metadata dari resource Google Cloud, yang mencakup artefak Vertex AI Pipelines seperti model Vertex AI, set data terkelola, dan resource Google Cloud lainnya yang dapat ditemukan di Data Catalog. Anda dapat menemukan artefak ini menggunakan kemampuan penelusuran metadata Data Catalog dan melihat grafik silsilahnya.

Untuk mengetahui informasi selengkapnya tentang kemampuan penelusuran metadata Data Catalog, lihat Menelusuri dan melihat aset data dengan Data Catalog.

Perlu diperhatikan bahwa Data Catalog mungkin tidak tersedia di semua region yang mendukung Vertex AI Pipelines. Jika Data Catalog tidak didukung di region Anda, gunakan Vertex ML Metadata. Lihat daftar region yang didukung untuk Data Catalog.

Ikuti petunjuk berikut guna melihat grafik silsilah untuk artefak pipeline di Dataplex:

  1. Untuk meluncurkan kueri penelusuran Dataplex di Konsol Google Cloud, buka halaman Dataplex Search.

    Buka Dataplex Search

  2. Gunakan filter untuk menelusuri artefak. Misalnya, Anda dapat menggunakan filter Jenis data untuk menentukan jenis artefak, seperti model, set data, atau tabel BigQuery. Untuk mengetahui informasi selengkapnya tentang penelusuran Data Catalog, lihat artikel Menelusuri aset data

    Anda juga dapat menentukan kueri di kolom penelusuran.

  3. Untuk melihat silsilah artefak, klik nama artefak, lalu klik tab Lineage.

    Pada grafik silsilah, proses Vertex AI didahului oleh Ikon silsilah Vertex AI. Hal ini termasuk artefak pipeline, komponen pipeline, dan template pipeline.

    • Untuk melihat detail proses, klik proses di grafik silsilah data.

    • Untuk proses yang didasarkan pada tugas pipeline dari proses pipeline, Anda dapat melakukan hal berikut:

      • Lihat pipeline yang dijalankan di Vertex AI dengan mengklik Open in Vertex AI di tab Details. Untuk melihat detail runtime dari suatu proses pipeline, seperti status, stempel waktu, dan atribut, klik Lainnya. Untuk melihat pipeline yang dijalankan di Vertex AI, klik Open in Vertex AI.
    • Untuk proses berdasarkan template pipeline, Anda dapat melakukan hal berikut:

      • Lihat detail template di Vertex AI dengan mengklik Open in Vertex AI di tab Details.

      • Lihat daftar tugas pipeline yang dibuat dalam operasi pipeline di tab Jalankan. Untuk melihat detail template pipeline di Vertex AI, klik More, lalu klik Open in Vertex AI.

Langkah selanjutnya