Memigrasikan metastore MySQL yang dikelola sendiri ke Dataproc Metastore

Halaman ini menunjukkan cara memigrasikan metastore MySQL eksternal yang dikelola sendiri ke Dataproc Metastore dengan membuat file dump MySQL dan mengimpor metadata ke layanan Dataproc Metastore yang ada.

Sebelum memulai

  1. Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
  2. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Go to project selector

  3. Make sure that billing is enabled for your Google Cloud project.

  4. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Go to project selector

  5. Make sure that billing is enabled for your Google Cloud project.

  6. Enable the Dataproc Metastore API.

    Enable the API

Peran yang Diperlukan

Untuk mendapatkan izin yang Anda perlukan guna membuat Metastore Dataproc dan mengimpor metastore MYSQL, minta administrator untuk memberi Anda peran IAM berikut:

  • Untuk membuat layanan dan mengimpor metadata:
  • Untuk menggunakan objek Cloud Storage (file dump SQL) untuk impor:
    • Storage Object Viewer (roles/storage.objectViewer) di agen layanan Dataproc Metastore. Misalnya, service-CUSTOMER_PROJECT_NUMBER@gcp-sa-metastore.iam.gserviceaccount.com.
    • Storage Object Viewer (roles/storage.objectViewer) di akun pengguna.

Untuk mengetahui informasi selengkapnya tentang cara memberikan peran, lihat Mengelola akses ke project, folder, dan organisasi.

Peran bawaan ini berisi izin yang diperlukan untuk membuat Metastore Dataproc dan mengimpor metastore MYSQL. Untuk melihat izin yang benar-benar diperlukan, luaskan bagian Izin yang diperlukan:

Izin yang diperlukan

Izin berikut diperlukan untuk membuat Dataproc Metastore dan mengimpor metastore MYSQL:

  • Untuk membuat layanan: metastore.services.create pada project.
  • Untuk mengimpor metadata: metastore.imports.create pada project.
  • Untuk menggunakan objek Cloud Storage (file dump SQL) untuk impor:
    • storage.objects.get di agen layanan Dataproc Metastore. Misalnya, service-CUSTOMER_PROJECT_NUMBER@gcp-sa-metastore.iam.gserviceaccount.com
    • storage.objects.get di akun pengguna.

Anda mungkin juga bisa mendapatkan izin ini dengan peran khusus atau peran bawaan lainnya.

Untuk mengetahui informasi selengkapnya tentang peran dan izin Dataproc Metastore tertentu, lihat Mengelola akses Dataproc dengan IAM.

Membuat layanan Metastore Dataproc

Petunjuk berikut menunjukkan cara membuat layanan Dataproc Metastore yang dapat Anda gunakan untuk memigrasikan file dump SQL.

Konsol

  1. Di konsol Google Cloud, buka halaman Create service:

    Buka Buat layanan

    Halaman Buat layanan.
    Dataproc MetastoreHalaman Buat layanan
  2. Di kolom Nama layanan, masukkan example-service.

  3. Pilih Data location. Untuk informasi tentang cara memilih region, lihat Lokasi Cloud.

  4. Untuk opsi konfigurasi layanan lainnya, gunakan default yang disediakan.

  5. Untuk membuat dan memulai layanan, klik tombol Kirim.

Layanan baru Anda akan muncul di daftar Layanan.

gcloud

Jalankan perintah gcloud metastore services create berikut untuk membuat layanan:

 gcloud metastore services create example-service \
     --location=LOCATION
 

Ganti LOCATION dengan region Compute Engine tempat Anda berencana membuat layanan. Pastikan Dataproc Metastore tersedia di region tersebut.

REST

Ikuti petunjuk API untuk membuat layanan menggunakan API Explorer.

Mempersiapkan untuk migrasi

Sekarang Anda harus menyiapkan metadata yang disimpan di database metastore Hive untuk impor dengan membuat file dump MySQL dan menempatkannya ke bucket Cloud Storage.

Lihat Menyiapkan file impor sebelum impor untuk mengetahui langkah-langkah persiapan migrasi.

Mengimpor metadata

Setelah Anda menyiapkan file dump, impor file tersebut ke dalam layanan Dataproc Metastore.

Lihat Mengimpor file ke Dataproc Metastore untuk mengetahui langkah-langkah mengimpor metadata ke layanan example-service.

Membuat dan melampirkan cluster Dataproc

Setelah mengimpor metadata ke layanan example-service Dataproc Metastore, buat dan lampirkan cluster Dataproc yang menggunakan layanan tersebut sebagai metastore Hive-nya.

Pembersihan

Agar tidak menimbulkan biaya pada akun Google Cloud Anda untuk resource yang digunakan pada halaman ini, ikuti langkah-langkah berikut.

  1. In the Google Cloud console, go to the Manage resources page.

    Go to Manage resources

  2. If the project that you plan to delete is attached to an organization, expand the Organization list in the Name column.
  3. In the project list, select the project that you want to delete, and then click Delete.
  4. In the dialog, type the project ID, and then click Shut down to delete the project.

Atau, Anda dapat menghapus resource yang digunakan dalam tutorial ini:

  1. Hapus layanan Dataproc Metastore.

    Konsol

    1. Di konsol Google Cloud, buka halaman Metastore Dataproc:

      Buka Dataproc Metastore di konsol Google Cloud

    2. Di sebelah kiri nama layanan, pilih example-service dengan mencentang kotak.

    3. Di bagian atas halaman Dataproc Metastore, klik Hapus untuk menghapus layanan.

    4. Pada dialog, klik Delete untuk mengonfirmasi penghapusan.

    Layanan Anda tidak lagi muncul di daftar Layanan.

    gcloud

    Jalankan perintah gcloud metastore services delete berikut untuk menghapus layanan:

     gcloud metastore services delete example-service \
         --location=LOCATION

    Ganti LOCATION dengan region Compute Engine tempat Anda membuat layanan.

    REST

    Ikuti petunjuk API untuk menghapus layanan menggunakan API Explorer.

    Semua penghapusan akan langsung berhasil.

  2. Hapus bucket Cloud Storage untuk layanan Dataproc Metastore.

Langkah selanjutnya