Jika menggunakan Data Catalog, Anda dapat mentransisikan konten dan penggunaan Data Catalog ke Katalog Dataplex dengan mengikuti langkah-langkah yang dijelaskan dalam dokumen ini.
Jika baru menggunakan katalog, Anda dapat memulai dengan Dataplex Catalog dengan mengonfigurasinya sebagai pengalaman katalog default.
Dokumen ini ditujukan untuk administrator data dan pengelola data.
Dataplex Catalog memiliki antarmuka dan API web baru. Beralih ke Katalog Dataplex memungkinkan workload dan pengguna Anda saat ini dan mendatang untuk mendapatkan manfaat dari fitur dan kemampuannya yang ditingkatkan. Untuk mengetahui informasi selengkapnya, lihat Ringkasan Katalog Dataplex.
Untuk perbandingan Katalog Dataplex dan Data Catalog, lihat Katalog Dataplex versus Data Catalog.
Sebelum memulai transisi, tinjau fitur yang tidak didukung di Katalog Dataplex.
Ringkasan transisi
Halaman Kelola transisi ke Dataplex di konsol Google Cloud menyediakan satu titik akses untuk mengelola transisi.
Bagian ini menjelaskan berbagai skenario transisi dan menguraikan proses transisi untuk setiap skenario.
Jika Anda tidak memiliki metadata kustom di Data Catalog atau jika Anda belum pernah menggunakan Data Catalog
Jika Anda menggunakan Data Catalog dan tidak memiliki metadata kustom, seperti tag, template tag, entri kustom, atau grup entri, atau jika Anda belum pernah menggunakan Data Catalog, selesaikan transisi dengan menetapkan pengalaman UI katalog default ke Katalog Dataplex.
Jika Anda memiliki metadata kustom Data Catalog atau beban kerja terprogram
Jika Anda menggunakan Data Catalog dengan metadata kustom (seperti tag, template tag, entri kustom, atau grup entri), Dataplex dapat otomatis mengimpor metadata kustom ini ke Katalog Dataplex sebagai read-only
. Untuk mengaktifkan kemampuan ini, perubahan konfigurasi diperlukan
seperti yang diuraikan dalam fase persiapan.
Fase kedua adalah fase transfer, saat status aktif (read-write
)
metadata kustom Anda dipindahkan ke Katalog Dataplex. Selama
fase ini, Anda juga harus memperbarui workload terprogram (seperti API,
library klien, modul Terraform, dan perintah Google Cloud CLI) untuk berinteraksi
dengan Katalog Dataplex.
Berikut adalah detail lebih lanjut tentang setiap fase proses transisi:
Fase persiapan: lakukan tugas konfigurasi yang diperlukan agar konten Data Catalog tersedia secara bersamaan di Katalog Dataplex sebagai
read-only
. Selama fase ini, Data Catalog tetap menjadi sumber tepercaya untuk konten metadata Anda.Fase persiapan mencakup tugas-tugas berikut:
- Perbarui template tag pribadi Data Catalog menjadi publik.
- Ikut serta dalam template tag dan tag untuk ketersediaan metadata secara bersamaan di Katalog Dataplex.
- Konfigurasikan izin IAM Katalog Dataplex untuk metadata kustom Anda.
Untuk mengetahui informasi selengkapnya, lihat Fase persiapan.
Fase transfer: pindahkan penggunaan katalog dan status aktif (
read-write
) metadata kustom Anda ke Dataplex Catalog.Fase transfer mencakup tugas-tugas berikut:
- Tetapkan pengalaman UI katalog default ke Katalog Dataplex.
- Transfer metadata kustom Data Catalog ke Katalog Dataplex.
- Memperbarui beban kerja terprogram.
Saat Anda menyelesaikan fase transfer, Katalog Dataplex menjadi sumber tepercaya untuk semua metadata Anda dan Anda tidak perlu menggunakan Data Catalog.
Untuk mengetahui informasi selengkapnya, lihat Fase transfer.
Peran yang diperlukan
Untuk mendapatkan izin yang Anda perlukan guna melakukan transisi dari Data Catalog ke Dataplex Catalog, berikan peran IAM berikut pada resource:
Memperbarui template tag pribadi menjadi publik: Data Catalog TagTemplate Owner (
roles/datacatalog.tagTemplateOwner
)Peran yang telah ditentukan ini berisi izin
datacatalog.tagTemplates.update
, yang diperlukan untuk memperbarui template tag pribadi menjadi publik.Ikut serta dalam template tag dan tag publik untuk ketersediaan metadata secara bersamaan di Katalog Dataplex: Admin Konfigurasi Migrasi DataCatalog (
roles/datacatalog.migrationConfigAdmin
)Peran yang telah ditentukan ini berisi izin
datacatalog.migrationConfig.set
, yang diperlukan untuk mengaktifkan template tag dan tag.Menetapkan pengalaman UI katalog default ke Katalog Dataplex: DataCatalog Migration Config Admin (
roles/datacatalog.migrationConfigAdmin
)Peran yang telah ditentukan ini berisi izin
datacatalog.migrationConfig.set
, yang diperlukan untuk menetapkan pengalaman UI katalog default.Mentransfer template tag publik Data Catalog ke Katalog Dataplex: Data Catalog TagTemplate Owner (
roles/datacatalog.tagTemplateOwner
)Peran yang telah ditentukan ini berisi izin
datacatalog.tagTemplates.update
, yang diperlukan untuk mentransfer template tag publik.Mentransfer grup entri Data Catalog ke Katalog Dataplex: DataCatalog EntryGroup Owner (
roles/datacatalog.entryGroupOwner
)Peran bawaan ini berisi izin
datacatalog.entryGroups.update
, yang diperlukan untuk mentransfer grup entri.
Untuk mengetahui informasi selengkapnya tentang pemberian peran, lihat Mengelola akses ke project, folder, dan organisasi.
Anda mungkin juga bisa mendapatkan izin ini dengan peran khusus atau peran standar lainnya.
Fase persiapan
Fase ini melibatkan tugas untuk membuat konten metadata Data Catalog
tersedia secara bersamaan di Katalog Dataplex, dalam
mode read-only
.
Berikut adalah poin-poin penting yang perlu diingat selama fase persiapan:
- Data Catalog tetap menjadi sumber tepercaya untuk metadata kustom Anda.
- Halaman Penelusuran Dataplex mengarah ke penelusuran Data Catalog secara default, yang hanya menyertakan metadata Data Catalog dan bukan metadata Katalog Dataplex.
- Penelusuran Katalog Dataplex mungkin tidak menyertakan semua template dan tag publik Data Catalog hingga Anda menyelesaikan fase persiapan.
Pelajari lebih lanjut ketersediaan metadata Data Catalog secara simultan di Katalog Dataplex
Grup entri kustom Data Catalog dan entrinya sudah tersedia secara bersamaan di Katalog Dataplex sebagai read-only
. Saat Anda
mengaktifkan template dan tag publik
pada fase persiapan, kontennya akan tersedia secara bersamaan di
Dataplex Catalog sebagai read-only
.
Tabel berikut menunjukkan pemetaan antara resource Data Catalog dan Dataplex Catalog saat resource Data Catalog tersedia secara bersamaan di Dataplex Catalog:
Referensi Data Catalog | Resource Dataplex Catalog yang sesuai | Deskripsi |
---|---|---|
Template tag | Jenis aspek (global) | Template tag di Data Catalog adalah resource regional. Saat Anda mengaktifkan template tag, kontennya akan tersedia secara bersamaan sebagai jenis aspek global di Katalog Dataplex. Hal ini dilakukan untuk mempertahankan referensi lintas regional antara tag dan template tag. Definisi jenis aspek global direplikasi ke semua region Google Cloud. Konsep standar seperti |
Tag | Aspek opsional | Saat Anda mengaktifkan template tag, tagnya akan tersedia secara bersamaan sebagai aspek opsional di Katalog Dataplex. Untuk mengetahui informasi selengkapnya, lihat Kategori aspek. |
Grup entri | Grup entri | Grup entri untuk entri sistem dibuat per project per region di Dataplex Catalog. Grup entri yang dibuat di Data Catalog akan tersedia secara bersamaan di Katalog Dataplex. |
Entri kustom | Entri kustom | Semua entri kustom di Data Catalog tersedia secara bersamaan sebagai entri GenericEntryType di Katalog Dataplex.
Untuk informasi selengkapnya, lihat
Kategori jenis entri.
|
Entri sistem (Google Cloud) | Aspek yang diperlukan entri sistem | Metadata yang menjelaskan entri sistem, seperti Schema untuk
tabel BigQuery, diambil dalam aspek yang diperlukan dari
jenis aspek yang ditentukan sistem.
|
Catatan: Biasanya, pembaruan pada konten Data Catalog disebarkan ke Katalog Dataplex dalam waktu 10 menit. Dalam beberapa kasus, mungkin diperlukan waktu hingga 24 jam. Untuk memastikan konsistensi data dalam beban kerja yang sangat penting, sebaiknya verifikasi resource Katalog Dataplex dengan resource Katalog Data atau sistem sumber asli sebelum digunakan.
Memperbarui template tag pribadi Data Catalog menjadi publik
Katalog Dataplex tidak mendukung konsep aspek pribadi (padanan dengan tag pribadi). Oleh karena itu, template tag dan tag privat tidak tersedia secara bersamaan di Katalog Dataplex. Untuk menyebarkan template dan tag pribadi di Katalog Dataplex, Anda harus memperbaruinya menjadi publik.
Sebelum melanjutkan, tinjau struktur template tag pribadi untuk memastikan bahwa struktur dan metadatanya konsisten dengan visibilitas tag publik.
Untuk memperbarui template tag dan tag pribadi menjadi publik, ikuti langkah-langkah berikut:
Konsol
Di konsol Google Cloud, buka halaman Katalog Dataplex.
Klik Kelola transisi ke Dataplex.
Klik tab Template tag pribadi.
Klik Kelola template tag.
Di halaman Tag templates, klik template tag pribadi yang ingin Anda perbarui.
Di halaman Detail template, klik Edit.
Di bagian Visibilitas, pilih Publik.
Klik Perbarui.
REST
Untuk memperbarui template tag pribadi menjadi publik, gunakan metode
tagTemplates.patch
.
Mengaktifkan template tag dan tag publik untuk ketersediaan metadata secara bersamaan di Katalog Dataplex
Saat Anda memilih ikut serta, konten template tag publik dan tag Data Catalog akan otomatis dan terus-menerus disebarkan ke Katalog Dataplex di seluruh organisasi atau project Google Cloud Anda (tanpa organisasi). Template dan tag publik Data Catalog di-propagasi ke Katalog Dataplex sebagai jenis dan aspek aspek publik. Definisi jenis aspek global direplikasi ke semua region Google Cloud.
Untuk mengaktifkan template dan tag publik, ikuti langkah-langkah berikut:
Konsol
Di konsol Google Cloud, buka halaman Katalog Dataplex.
Klik Kelola transisi ke Dataplex.
Klik tab Ikut serta.
Klik Berikan keikutsertaan.
Pada dialog konfirmasi, masukkan teks yang ditampilkan, lalu klik Konfirmasi.
REST
Untuk memilih ikut serta dalam template tag dan tag, gunakan metode
setConfig
.
Untuk organisasi Google Cloud dan project tanpa organisasi, Anda dapat mencabut keikutsertaan yang awalnya diberikan, dengan mengklik Cabut keikutsertaan. Saat Anda mencabut keikutsertaan, proses penyebaran template tag dan tag Data Catalog ke Katalog Dataplex akan berhenti. Jenis aspek dan aspek Dataplex Catalog yang dibuat oleh proses keikutsertaan, tetapi tidak ditransfer ke Dataplex Catalog, akan dihapus. Proses penghapusan mungkin memerlukan waktu hingga 12 jam.
Mengonfigurasi izin IAM Katalog Dataplex untuk metadata kustom Anda
Jenis aspek Katalog Dataplex dan grup entri kustom yang mewakili template tag dan grup entri dari Data Catalog tidak mewarisi izin IAM Data Catalog asli. Anda harus mengonfigurasi izin IAM Dataplex secara manual untuk jenis aspek dan grup entri kustom tersebut.
Misalnya, jika ingin membuat aspek menggunakan jenis aspek yang di-propagate (yang mewakili template tag Data Catalog), Anda harus mengonfigurasi izin IAM yang diperlukan untuk jenis aspek tersebut. Demikian pula, saat menyerap metadata kustom, untuk membuat entri kustom dalam grup entri kustom yang di-propagate, Anda harus mengonfigurasi izin IAM yang diperlukan untuk grup entri tersebut.
Untuk mengonfigurasi izin IAM Dataplex yang diperlukan untuk jenis aspek dan grup entri kustom, ikuti langkah-langkah berikut:
Konsol
Di konsol Google Cloud, buka halaman Katalog Dataplex.
Klik Kelola transisi ke Dataplex.
Klik tab Izin Dataplex.
Untuk mengonfigurasi izin IAM Dataplex untuk jenis aspek, klik Jenis aspek dan template tag.
Untuk template tag yang di-push dari Data Catalog, klik > Permissions.
Klik Add principals.
Tambahkan akun utama baru, lalu tetapkan peran yang diperlukan.
Klik Simpan.
Untuk mengonfigurasi izin IAM Dataplex untuk grup entri, klik Grup entri.
Untuk grup entri yang di-propagate dari Katalog Data, klik > Permissions.
Klik Add principals.
Tambahkan akun utama baru, lalu tetapkan peran yang diperlukan.
Klik Simpan.
REST
Untuk mengonfigurasi izin IAM Dataplex untuk
jenis aspek, gunakan
metode
aspectTypes.setIamPolicy
.
Untuk mengonfigurasi izin IAM Dataplex untuk
grup entri, gunakan
metode
entryGroups.setIamPolicy
.
Fase transfer
Fase ini melibatkan tugas untuk memindahkan status aktif (read-write
) metadata kustom Data Catalog Anda ke Katalog Dataplex.
Berikut adalah poin-poin penting yang perlu diingat selama fase transfer:
- Halaman Penelusuran Dataplex mengarah ke penelusuran Katalog Dataplex secara default.
- Anda dapat menemukan dan membaca metadata Data Catalog dan Dataplex Catalog di Dataplex Catalog.
- Untuk memperbarui metadata di konsol Google Cloud, Anda akan dialihkan ke sumbernya. Misalnya, jika Anda memperbarui template tag Data Catalog, Anda akan dialihkan ke halaman template tag di Data Catalog.
Menetapkan pengalaman UI katalog default ke Katalog Dataplex
Menetapkan pengalaman UI katalog default ke Katalog Dataplex berarti hal berikut:
Saat Anda membuka halaman Penelusuran Dataplex di konsol Google Cloud, penelusuran Katalog Dataplex akan ditampilkan secara default. Penelusuran Dataplex Catalog beroperasi di atas Dataplex Catalog dan menemukan semua konten metadata Anda, termasuk konten yang dibuat di Dataplex Catalog dan konten yang diambil dari Data Catalog.
Penelusuran Data Catalog hanya menemukan konten Data Catalog, bukan konten Katalog Dataplex. Oleh karena itu, sebaiknya gunakan penelusuran Katalog Dataplex.
Antarmuka web mendorong Anda untuk membuat resource baru di Katalog Dataplex. Misalnya, setelan defaultnya adalah Create Aspect Types, bukan Create Tag Templates, dan Create Entry Group (Dataplex Catalog), bukan Create Entry Group (Data Catalog).
Menetapkan pengalaman UI katalog default ke Katalog Dataplex biasanya merupakan operasi satu arah. Namun, Dataplex memungkinkan Anda mengembalikan perubahan dalam kasus luar biasa, misalnya, saat Anda ingin mengalihkan pengalaman UI Katalog default kembali ke Data Catalog. Jika Anda mengembalikan perubahan, Anda tidak dapat mengakses konten apa pun yang dibuat di Katalog Dataplex, di antarmuka web Data Catalog.
Untuk menetapkan pengalaman UI katalog default ke Katalog Dataplex, ikuti langkah-langkah berikut:
Konsol
Di konsol Google Cloud, buka halaman Katalog Dataplex.
Klik Kelola transisi ke Dataplex.
Klik tab Penelusuran Dataplex.
Klik Set the default Catalog UI experience to Dataplex Catalog.
REST
Untuk menetapkan pengalaman UI katalog default ke Katalog Dataplex,
gunakan
metode
setConfig
.
Mentransfer metadata kustom Data Catalog ke Katalog Dataplex
Anda dapat mentransfer template tag publik Data Catalog (yang Anda ikut serta) dan grup entri kustom ke Katalog Dataplex. Pastikan Anda mentransfer setiap template tag dan grup entri kustom secara terpisah.
Berikut ringkasan proses transfer:
Efek
- Mentransfer status aktif untuk resource dari Data Catalog ke Katalog Dataplex. Setelah transfer, untuk mengubah resource atau mengakses statusnya saat ini, Anda harus menggunakan Katalog Dataplex.
Perubahan pada konten dan alur data
- Menandai resource sebagai
read-only
di Data Catalog. - Menandai resource sebagai
read-write
di Katalog Dataplex. - Menghentikan ketersediaan serentak resource ini.
- Menandai resource sebagai
Dependensi
- Mentransfer template tag juga akan mentransfer semua tag yang menggunakan template tersebut.
- Mentransfer grup entri juga akan mentransfer semua entri dalam grup tersebut.
- Mentransfer entri tidak memengaruhi status transfer tag dan template tagnya masing-masing.
Sebelum transfer, untuk mengubah konteks bisnis entri (misalnya,
overview
, contacts
), Anda dapat menggunakan Data Catalog
dan Dataplex API. Setelah transfer, Anda hanya boleh menggunakan
Dataplex API.
Berikut ini menjelaskan operasi yang diizinkan untuk entri Data Catalog kustom yang diberi tag, bergantung pada status transfer grup entri kustom dan template tag terkait:
- Saat template tag aktif di Data Catalog, Anda dapat menggunakan template tag tersebut untuk membuat tag. Setelah mentransfer template tag ke Katalog Dataplex, Anda tidak dapat menggunakannya untuk membuat tag di Data Catalog.
- Anda dapat membuat aspek menggunakan jenis aspek yang di-propagate dari template tag Data Catalog, hanya setelah Anda mentransfer template tag.
Untuk mentransfer template tag Data Catalog dan grup entri kustom ke Katalog Dataplex, ikuti langkah-langkah berikut:
Konsol
Di konsol Google Cloud, buka halaman Katalog Dataplex.
Klik Kelola transisi ke Dataplex.
Klik tab Transfer to Dataplex.
Untuk mentransfer template tag Data Catalog ke Katalog Dataplex, klik Lihat jenis aspek dan template tag.
Pilih template tag yang ingin Anda transfer.
Klik Transfer.
Pada dialog konfirmasi, klik Confirm.
Untuk mentransfer grup entri kustom Data Catalog ke Katalog Dataplex, klik Lihat grup entri.
Pilih grup entri yang ingin Anda transfer.
Klik Transfer.
Pada dialog konfirmasi, klik Confirm.
REST
Untuk mentransfer template tag Data Catalog dan grup entri kustom ke Katalog Dataplex, gunakan metode tagTemplates.patch
.
Saat Anda menyelesaikan fase transfer, Katalog Dataplex menjadi sumber tepercaya untuk semua metadata, dan Anda tidak perlu menggunakan Data Catalog.
Memperbarui workload terprogram
Katalog Dataplex dilengkapi dengan API, library klien, modul Terraform, dan perintah Google Cloud CLI baru. Oleh karena itu, Anda harus mengupdate workload yang ada dengan penggunaan terprogram Data Catalog ke Katalog Dataplex. Lihat contoh kode untuk Dataplex.
Pastikan Anda menyelaraskan pembaruan beban kerja terprogram dengan mentransfer
resource dependen, seperti template tag dan grup entri kustom. Hal ini
diperlukan karena mentransfer akan memindahkan status aktif (read-write
)
resource dari Data Catalog ke Dataplex Catalog.
Berikut adalah contoh urutan pembaruan beban kerja terprogram untuk berinteraksi dengan Katalog Dataplex, yang dikoordinasikan dengan mentransfer resource dependen:
Jika workload Anda dapat menoleransi konsistensi akhir, pindahkan operasi
read
workload ke Katalog Dataplex.Pindahkan beban kerja yang melakukan operasi
write
pemberian tag ke Katalog Dataplex yang dikoordinasikan dengan mentransfer template tag yang sesuai.Pindahkan beban kerja yang melakukan operasi
write
penyerapan kustom ke Katalog Dataplex yang dikoordinasikan dengan mentransfer grup entri kustom masing-masing.
Jika Anda perlu memisahkan beban kerja pembaruan dan mentransfer resource
yang sesuai, pertimbangkan untuk menerapkan logika dalam beban kerja untuk merutekan
read-write
ke Katalog Data atau Katalog Dataplex
pada status transfer resource. Dengan demikian, workload akan beroperasi secara independen dari
status transfer resource terkait.
Langkah selanjutnya
- Pelajari Katalog Dataplex lebih lanjut.
- Pelajari cara menelusuri resource di Katalog Dataplex.
- Pelajari cara mengelola aspek dan memperkaya metadata di Katalog Dataplex.
- Pelajari cara mengelola entri dan menyerap sumber kustom di Katalog Dataplex.
- Lihat referensi Dataplex Catalog API.