Memigrasikan metastore MySQL yang dikelola sendiri ke Dataproc Metastore
Halaman ini menunjukkan cara memigrasikan metastore MySQL eksternal yang dikelola sendiri ke Dataproc Metastore dengan membuat file dump MySQL dan mengimpor metadata ke layanan Dataproc Metastore yang ada.
Sebelum memulai
- Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Make sure that billing is enabled for your Google Cloud project.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Make sure that billing is enabled for your Google Cloud project.
-
Enable the Dataproc Metastore API.
Peran yang Diperlukan
Untuk mendapatkan izin yang Anda perlukan guna membuat Metastore Dataproc dan mengimpor metastore MYSQL, minta administrator untuk memberi Anda peran IAM berikut:
-
Untuk membuat layanan dan mengimpor metadata:
-
Dataproc Metastore Editor (
roles/metastore.editor
) di project -
Dataproc Metastore Admin (
roles/metastore.admin
) pada project.
-
Dataproc Metastore Editor (
-
Untuk menggunakan objek Cloud Storage (file dump SQL) untuk impor:
-
Storage Object Viewer (
roles/storage.objectViewer
) di agen layanan Dataproc Metastore. Misalnya,service-CUSTOMER_PROJECT_NUMBER@gcp-sa-metastore.iam.gserviceaccount.com
. -
Storage Object Viewer (
roles/storage.objectViewer
) di akun pengguna.
-
Storage Object Viewer (
Untuk mengetahui informasi selengkapnya tentang cara memberikan peran, lihat Mengelola akses ke project, folder, dan organisasi.
Peran bawaan ini berisi izin yang diperlukan untuk membuat Metastore Dataproc dan mengimpor metastore MYSQL. Untuk melihat izin yang benar-benar diperlukan, luaskan bagian Izin yang diperlukan:
Izin yang diperlukan
Izin berikut diperlukan untuk membuat Dataproc Metastore dan mengimpor metastore MYSQL:
-
Untuk membuat layanan:
metastore.services.create
pada project. -
Untuk mengimpor metadata:
metastore.imports.create
pada project. -
Untuk menggunakan objek Cloud Storage (file dump SQL) untuk impor:
-
storage.objects.get
di agen layanan Dataproc Metastore. Misalnya,service-CUSTOMER_PROJECT_NUMBER@gcp-sa-metastore.iam.gserviceaccount.com
-
storage.objects.get
di akun pengguna.
-
Anda mungkin juga bisa mendapatkan izin ini dengan peran khusus atau peran bawaan lainnya.
Untuk mengetahui informasi selengkapnya tentang peran dan izin Dataproc Metastore tertentu, lihat Mengelola akses Dataproc dengan IAM.Membuat layanan Metastore Dataproc
Petunjuk berikut menunjukkan cara membuat layanan Dataproc Metastore yang dapat Anda gunakan untuk memigrasikan file dump SQL.
Konsol
Di konsol Google Cloud, buka halaman Create service:
Di kolom Nama layanan, masukkan
example-service
.Pilih Data location. Untuk informasi tentang cara memilih region, lihat Lokasi Cloud.
Untuk opsi konfigurasi layanan lainnya, gunakan default yang disediakan.
Untuk membuat dan memulai layanan, klik tombol Kirim.
Layanan baru Anda akan muncul di daftar Layanan.
gcloud
Jalankan perintah gcloud metastore services create
berikut untuk membuat layanan:
gcloud metastore services create example-service \ --location=LOCATION
Ganti LOCATION
dengan region Compute Engine tempat Anda berencana membuat layanan. Pastikan Dataproc Metastore tersedia
di region tersebut.
REST
Ikuti petunjuk API untuk membuat layanan menggunakan API Explorer.
Mempersiapkan untuk migrasi
Sekarang Anda harus menyiapkan metadata yang disimpan di database metastore Hive untuk impor dengan membuat file dump MySQL dan menempatkannya ke bucket Cloud Storage.
Lihat Menyiapkan file impor sebelum impor untuk mengetahui langkah-langkah persiapan migrasi.
Mengimpor metadata
Setelah Anda menyiapkan file dump, impor file tersebut ke dalam layanan Dataproc Metastore.
Lihat Mengimpor file ke Dataproc Metastore
untuk mengetahui langkah-langkah mengimpor metadata ke layanan example-service
.
Membuat dan melampirkan cluster Dataproc
Setelah mengimpor metadata ke layanan example-service
Dataproc Metastore, buat dan lampirkan cluster Dataproc yang menggunakan layanan tersebut sebagai metastore Hive-nya.
Pembersihan
Agar tidak menimbulkan biaya pada akun Google Cloud Anda untuk resource yang digunakan pada halaman ini, ikuti langkah-langkah berikut.
- In the Google Cloud console, go to the Manage resources page.
- If the project that you plan to delete is attached to an organization, expand the Organization list in the Name column.
- In the project list, select the project that you want to delete, and then click Delete.
- In the dialog, type the project ID, and then click Shut down to delete the project.
Atau, Anda dapat menghapus resource yang digunakan dalam tutorial ini:
Hapus layanan Dataproc Metastore.
Konsol
Di konsol Google Cloud, buka halaman Metastore Dataproc:
Di sebelah kiri nama layanan, pilih
example-service
dengan mencentang kotak.Di bagian atas halaman Dataproc Metastore, klik Hapus untuk menghapus layanan.
Pada dialog, klik Delete untuk mengonfirmasi penghapusan.
Layanan Anda tidak lagi muncul di daftar Layanan.
gcloud
Jalankan perintah
gcloud metastore services delete
berikut untuk menghapus layanan:gcloud metastore services delete example-service \ --location=LOCATION
Ganti
LOCATION
dengan region Compute Engine tempat Anda membuat layanan.REST
Ikuti petunjuk API untuk menghapus layanan menggunakan API Explorer.
Semua penghapusan akan langsung berhasil.
Hapus bucket Cloud Storage untuk layanan Dataproc Metastore.