Melacak silsilah artefak pipeline

Setiap operasi pipeline yang dibuat menggunakan Vertex AI Pipelines memiliki beberapa artefak dan parameter terkait, seperti model, set data, template pipeline, dan komponen. Silsilah artefak pipeline mencakup faktor yang berkontribusi pada pembuatannya, serta artefak dan metadata yang berasal dari artefak. Misalnya, silsilah model dapat mencakup hal berikut:

  • Data pelatihan, pengujian, dan evaluasi yang digunakan untuk membuat model.

  • Hyperparameter yang digunakan selama pelatihan model.

  • Metadata yang dikumpulkan dari proses pelatihan dan evaluasi, seperti akurasi model.

  • Artefak yang berasal dari model ini, seperti hasil prediksi batch.

Anda dapat menggunakan metadata ini untuk membantu menjawab pertanyaan seperti berikut:

  • Mengapa operasi pipeline tertentu menghasilkan model yang sangat akurat?

  • Operasi pipeline mana yang menghasilkan model paling akurat, dan hyperparameter apa yang digunakan untuk melatih model tersebut?

  • Bergantung pada langkah-langkah dalam pipeline, Anda mungkin dapat menjawab pertanyaan tata kelola sistem. Misalnya, Anda dapat menggunakan metadata untuk menentukan versi model mana yang berada dalam produksi pada titik waktu tertentu.

Untuk melihat dan menganalisis silsilah artefak pipeline, Anda dapat menggunakan Vertex ML Metadata atau Dataplex.

Tabel berikut menguraikan perbedaan antara Metadata Vertex ML dan Dataplex:

Fitur Vertex ML Metadata Dataplex
Jenis metadata pipeline yang diambil Semua artefak input dan output yang dihasilkan oleh operasi pipeline. Artefak input dan output yang dapat dipetakan ke nama yang sepenuhnya memenuhi syarat (FQN) yang didukung oleh Dataplex, umumnya menggunakan Komponen Pipeline Google Cloud.
Geografi Pembacaan satu region. Pembacaan global, yaitu di beberapa region.
Project Satu project dibaca. Pembacaan di seluruh organisasi di beberapa project.
Layanan terintegrasi Terintegrasi dengan Vertex AI Pipelines, Vertex AI Experiments, Vertex AI Model Registry, dan Set Data. Terintegrasi dengan beberapa produk Google Cloud, seperti Vertex AI, BigQuery, Cloud Composer, dan Dataproc.
Ikut serta? Tidak, selalu aktif. Ikut serta per project dengan mengaktifkan Data Lineage API.

Memetakan artefak Vertex ML Metadata ke Dataplex

Untuk memetakan artefak Vertex ML Metadata ke FQN di Dataplex, Anda perlu melakukan hal berikut:

  • Gunakan Komponen Pipeline Google Cloud saat membuat model Vertex AI dan set data terkelola.

  • Gunakan judul skema kustom (google.VertexDataset atau google.VertexModel) saat menentukan nama resource model atau set data terkelola di kolom metadata, seperti yang diilustrasikan dalam contoh berikut:

{
  "name": "projects/example-project/locations/us-central1/metadataStores/default/artifacts/example-artifact",
  "displayName": "My dataset",
  "uri": "https://us-central1-aiplatform.googleapis.com/v1/projects/example-project/locations/us-central1/datasets/example-dataset",
   ...
  "schemaTitle": "google.VertexDataset",
  "schemaVersion": "0.0.1",
  "metadata": {
    "resourceName": "projects/example-project/locations/us-central1/datasets/example-dataset"
  }
}

Menganalisis silsilah artefak pipeline menggunakan Vertex ML Metadata

Saat Anda menjalankan pipeline menggunakan Vertex AI Pipelines, artefak dan parameter dari pipeline yang dijalankan akan disimpan menggunakan Vertex ML Metadata. Vertex ML Metadata memudahkan analisis silsilah artefak pipeline Anda, dengan memudahkan Anda melacak metadata pipeline Anda.

Jika Anda baru mengenal Vertex ML Metadata, baca pengantar Vertex ML Metadata.

Ikuti petunjuk berikut untuk melihat grafik silsilah untuk artefak pipeline menggunakan Vertex ML Metadata:

  1. Di Konsol Google Cloud, di bagian Vertex AI, buka halaman Metadata.

    Buka Metadata

    Halaman Metadata mencantumkan artefak yang telah dibuat di penyimpanan metadata default.

  2. Di menu drop-down Region, pilih region tempat proses Anda dibuat.

  3. Klik Display name artefak untuk melihat grafik silsilahnya.

    Grafik statis yang menunjukkan artefak dan eksekusi yang merupakan bagian dari grafik silsilah ini akan muncul.

  4. Klik artefak atau eksekusi untuk mempelajari lebih lanjut.

Menganalisis silsilah artefak pipeline menggunakan Dataplex

Data Catalog Dataplex menemukan metadata dari resource Google Cloud, yang mencakup artefak Vertex AI Pipelines seperti model Vertex AI, set data terkelola, dan resource Google Cloud lainnya yang dapat ditemukan di Data Catalog. Anda dapat menemukan artefak ini menggunakan kemampuan penelusuran metadata Data Catalog dan melihat grafik silsilahnya.

Untuk mengetahui informasi selengkapnya tentang kemampuan penelusuran metadata Data Catalog, lihat Menelusuri dan melihat aset data dengan Data Catalog.

Perhatikan bahwa Katalog Data mungkin tidak tersedia di semua region tempat Vertex AI Pipelines didukung. Jika Data Catalog tidak didukung di region Anda, gunakan Vertex ML Metadata. Lihat daftar region yang didukung untuk Data Catalog.

Ikuti petunjuk berikut untuk melihat grafik silsilah untuk artefak pipeline di Dataplex:

  1. Untuk meluncurkan kueri penelusuran Dataplex di konsol Google Cloud, buka halaman Penelusuran Dataplex.

    Buka Penelusuran Dataplex

  2. Gunakan filter untuk menelusuri artefak. Misalnya, Anda dapat menggunakan filter Jenis data untuk menentukan jenis artefak, seperti model, set data, atau tabel BigQuery. Untuk mengetahui informasi selengkapnya tentang penelusuran Data Catalog, lihat Menelusuri aset data

    Anda juga dapat menentukan kueri di kolom penelusuran.

  3. Untuk melihat silsilah artefak, klik nama artefak, lalu klik tab Lineage.

    Pada grafik silsilah, proses Vertex AI didahului oleh Ikon silsilah Vertex AI. Hal ini mencakup artefak pipeline, komponen pipeline, dan template pipeline.

    • Untuk melihat detail proses, klik proses di grafik garis keturunan.

    • Untuk proses berdasarkan tugas pipeline dari proses pipeline, Anda dapat melakukan hal berikut:

      • Lihat pipeline yang dijalankan di Vertex AI dengan mengklik Buka di Vertex AI di tab Detail. Untuk melihat detail runtime operasi pipeline, seperti status, stempel waktu, dan atribut, klik Lainnya. Untuk melihat pipeline yang dijalankan di Vertex AI, klik Buka di Vertex AI.
    • Untuk proses berdasarkan template pipeline, Anda dapat melakukan hal berikut:

      • Lihat detail template di Vertex AI dengan mengklik Open in Vertex AI di tab Details.

      • Lihat daftar tugas pipeline yang dibuat dalam operasi pipeline di tab Runs. Untuk melihat detail template pipeline di Vertex AI, klik Lainnya, lalu klik Buka di Vertex AI.

Langkah selanjutnya