Menjalankan terjemahan batch menggunakan konektor Cloud Translation


Tutorial ini menunjukkan cara membuat alur kerja yang menggunakan konektor Cloud Translation API untuk menerjemahkan file ke bahasa lain dalam mode batch asinkron. Hal ini memberikan output real-time saat input sedang diproses.

Tujuan

Dalam tutorial ini, Anda akan:

  1. Buat bucket Cloud Storage input.
  2. Buat dua file dalam bahasa Inggris dan upload ke bucket input.
  3. Buat alur kerja yang menggunakan konektor Cloud Translation API untuk menerjemahkan dua file ke bahasa Prancis dan Spanyol, lalu menyimpan hasilnya di bucket output.
  4. Men-deploy dan menjalankan alur kerja untuk mengatur seluruh proses.

Biaya

Dalam dokumen ini, Anda akan menggunakan komponen Google Cloud yang dapat ditagih berikut:

Untuk membuat perkiraan biaya berdasarkan proyeksi penggunaan Anda, gunakan kalkulator harga. Pengguna baru Google Cloud mungkin memenuhi syarat untuk mendapatkan uji coba gratis.

Sebelum memulai

Batasan keamanan yang ditentukan oleh organisasi mungkin mencegah Anda menyelesaikan langkah-langkah berikut. Untuk mengetahui informasi pemecahan masalah, lihat Mengembangkan aplikasi di lingkungan Google Cloud yang terbatas.

  1. Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
  2. Install the Google Cloud CLI.
  3. To initialize the gcloud CLI, run the following command:

    gcloud init
  4. Create or select a Google Cloud project.

    • Create a Google Cloud project:

      gcloud projects create PROJECT_ID

      Replace PROJECT_ID with a name for the Google Cloud project you are creating.

    • Select the Google Cloud project that you created:

      gcloud config set project PROJECT_ID

      Replace PROJECT_ID with your Google Cloud project name.

  5. Make sure that billing is enabled for your Google Cloud project.

  6. Enable the Cloud Storage, Translation, and Workflows APIs:

    gcloud services enable storage.googleapis.com translate.googleapis.com workflows.googleapis.com
  7. Install the Google Cloud CLI.
  8. To initialize the gcloud CLI, run the following command:

    gcloud init
  9. Create or select a Google Cloud project.

    • Create a Google Cloud project:

      gcloud projects create PROJECT_ID

      Replace PROJECT_ID with a name for the Google Cloud project you are creating.

    • Select the Google Cloud project that you created:

      gcloud config set project PROJECT_ID

      Replace PROJECT_ID with your Google Cloud project name.

  10. Make sure that billing is enabled for your Google Cloud project.

  11. Enable the Cloud Storage, Translation, and Workflows APIs:

    gcloud services enable storage.googleapis.com translate.googleapis.com workflows.googleapis.com
  12. Perbarui komponen gcloud:
    gcloud components update
  13. Login menggunakan akun Anda:
    gcloud auth login
  14. Setel lokasi default yang digunakan dalam tutorial ini:
    gcloud config set workflows/location us-central1

    Karena tutorial ini menggunakan model AutoML Translation default yang berada di us-central1, Anda harus menetapkan lokasi ke us-central1.

    Jika menggunakan model atau glosarium Terjemahan AutoML selain default, pastikan model atau glosarium tersebut berada di lokasi yang sama dengan panggilan ke konektor. Jika tidak, error INVALID_ARGUMENT (400) akan ditampilkan. Untuk mengetahui detailnya, lihat metode batchTranslateText.

Membuat bucket dan file Cloud Storage input

Anda dapat menggunakan Cloud Storage untuk menyimpan objek. Objek adalah bagian data yang tidak dapat diubah dan terdiri dari file dalam format apa pun, dan disimpan dalam penampung yang disebut bucket.

  1. Buat bucket Cloud Storage untuk menyimpan file yang akan diterjemahkan:

    BUCKET_INPUT=${GOOGLE_CLOUD_PROJECT}-input-files
    gcloud storage buckets create gs://${BUCKET_INPUT}
  2. Buat dua file dalam bahasa Inggris dan upload ke bucket input:

    echo "Hello World!" > file1.txt
    gcloud storage cp file1.txt gs://${BUCKET_INPUT}
    echo "Workflows connectors simplify calling services." > file2.txt
    gcloud storage cp file2.txt gs://${BUCKET_INPUT}

Men-deploy dan menjalankan alur kerja

Alur kerja terdiri dari serangkaian langkah yang dijelaskan menggunakan sintaksis Workflows, yang dapat ditulis dalam format YAML atau JSON. Ini adalah definisi alur kerja. Setelah membuat alur kerja, Anda men-deploynya agar tersedia untuk dieksekusi.

  1. Buat file teks dengan nama file workflow.yaml dan dengan konten berikut:

    main:
      steps:
      - init:
          assign:
          - projectId: ${sys.get_env("GOOGLE_CLOUD_PROJECT_ID")}
          - location: ${sys.get_env("GOOGLE_CLOUD_LOCATION")}
          - inputBucketName: ${projectId + "-input-files"}
          - outputBucketName: ${projectId + "-output-files-" + string(int(sys.now()))}
      - createOutputBucket:
            call: googleapis.storage.v1.buckets.insert
            args:
              project: ${projectId}
              body:
                name: ${outputBucketName}
      - batchTranslateText:
          call: googleapis.translate.v3beta1.projects.locations.batchTranslateText
          args:
              parent: ${"projects/" + projectId + "/locations/" + location}
              body:
                  inputConfigs:
                    gcsSource:
                      inputUri: ${"gs://" + inputBucketName + "/*"}
                  outputConfig:
                      gcsDestination:
                        outputUriPrefix: ${"gs://" + outputBucketName + "/"}
                  sourceLanguageCode: "en"
                  targetLanguageCodes: ["es", "fr"]
          result: batchTranslateTextResult

    Alur kerja menetapkan variabel, membuat bucket output, dan memulai terjemahan file, yang menyimpan hasilnya ke bucket output.

  2. Setelah membuat alur kerja, deploy alur kerja tersebut:

    gcloud workflows deploy batch-translation --source=workflow.yaml
  3. Menjalankan alur kerja:

    gcloud workflows execute batch-translation
  4. Untuk melihat status alur kerja, Anda dapat menjalankan perintah yang ditampilkan. Contoh:

    gcloud workflows executions describe eb4a6239-cffa-4672-81d8-d4caef7d8424 /
      --workflow batch-translation /
      --location us-central1

    Alur kerja harus ACTIVE. Setelah beberapa menit, file yang diterjemahkan (dalam bahasa Prancis dan Spanyol) akan diupload ke bucket output.

Membuat daftar objek di bucket output

Anda dapat mengonfirmasi bahwa alur kerja berfungsi seperti yang diharapkan dengan mencantumkan objek di bucket output.

  1. Ambil nama bucket output Anda:

    gcloud storage ls

    Outputnya mirip dengan hal berikut ini:

    gs://PROJECT_ID-input-files/
    gs://PROJECT_ID-output-files-TIMESTAMP/

  2. Buat daftar objek di bucket output Anda:

    gcloud storage ls gs://PROJECT_ID-output-files-TIMESTAMP/** --recursive

    Setelah beberapa menit, file terjemahan, dua file dalam bahasa Prancis dan Spanyol, akan tercantum.

Pembersihan

Jika Anda membuat project baru untuk tutorial ini, hapus project tersebut. Jika Anda menggunakan project yang ada dan ingin mempertahankannya tanpa perubahan yang ditambahkan dalam tutorial ini, hapus resource yang dibuat untuk tutorial.

Menghapus project

Cara termudah untuk menghilangkan penagihan adalah dengan menghapus project yang Anda buat untuk tutorial.

Untuk menghapus project:

  1. In the Google Cloud console, go to the Manage resources page.

    Go to Manage resources

  2. In the project list, select the project that you want to delete, and then click Delete.
  3. In the dialog, type the project ID, and then click Shut down to delete the project.

Menghapus resource tutorial

  1. Hapus konfigurasi default gcloud yang Anda tambahkan selama penyiapan tutorial:

    gcloud config unset workflows/location
  2. Menghapus alur kerja yang dibuat dalam tutorial ini:

    gcloud workflows delete WORKFLOW_NAME
  3. Hapus bucket yang dibuat dalam tutorial ini:

    gcloud storage rm gs://BUCKET_NAME --recursive

    Dengan BUCKET_NAME adalah nama bucket yang akan dihapus. Contoh, my-bucket.

    Responsnya mirip dengan hal berikut ini:

    Removing gs://my-bucket/...

Langkah selanjutnya