Cloud Translation 커넥터를 사용하여 일괄 번역 실행


이 튜토리얼에서는 Cloud Translation API 커넥터를 사용하여 비동기 배치 모드에서 파일을 다른 언어로 번역하는 워크플로를 만드는 방법을 보여줍니다. 이는 입력이 처리되는 동안 실시간 출력을 제공합니다.

목표

이 가이드에서는 다음 단계를 진행합니다.

  1. 입력 Cloud Storage 버킷을 만듭니다.
  2. 영어로 파일 2개를 만들어 입력 버킷에 업로드합니다.
  3. Cloud Translation API 커넥터를 사용하여 두 파일을 프랑스어 및 스페인어로 번역하고 결과를 출력 버킷에 저장하는 워크플로를 만듭니다.
  4. 워크플로를 배포하고 실행하여 전체 프로세스를 조정합니다.

비용

이 문서에서는 비용이 청구될 수 있는 다음과 같은 Google Cloud 구성요소를 사용합니다.

프로젝트 사용량을 기준으로 예상 비용을 산출하려면 가격 계산기를 사용하세요. Google Cloud를 처음 사용하는 사용자는 무료 체험판을 사용할 수 있습니다.

시작하기 전에

조직에서 정의한 보안 제약조건으로 인해 다음 단계를 완료하지 못할 수 있습니다. 문제 해결 정보는 제한된 Google Cloud 환경에서 애플리케이션 개발을 참조하세요.

  1. Google Cloud 계정에 로그인합니다. Google Cloud를 처음 사용하는 경우 계정을 만들고 Google 제품의 실제 성능을 평가해 보세요. 신규 고객에게는 워크로드를 실행, 테스트, 배포하는 데 사용할 수 있는 $300의 무료 크레딧이 제공됩니다.
  2. Google Cloud CLI를 설치합니다.
  3. gcloud CLI를 초기화하려면 다음 명령어를 실행합니다.

    gcloud init
  4. Google Cloud 프로젝트를 만들거나 선택합니다.

    • Google Cloud 프로젝트를 만듭니다.

      gcloud projects create PROJECT_ID

      PROJECT_ID를 만들려는 Google Cloud 프로젝트의 이름으로 바꿉니다.

    • 만든 Google Cloud 프로젝트를 선택합니다.

      gcloud config set project PROJECT_ID

      PROJECT_ID를 Google Cloud 프로젝트 이름으로 바꿉니다.

  5. Google Cloud 프로젝트에 결제가 사용 설정되어 있는지 확인합니다.

  6. Cloud Storage, Translation, and Workflows API를 사용 설정합니다.

    gcloud services enable storage.googleapis.com translate.googleapis.com workflows.googleapis.com
  7. Google Cloud CLI를 설치합니다.
  8. gcloud CLI를 초기화하려면 다음 명령어를 실행합니다.

    gcloud init
  9. Google Cloud 프로젝트를 만들거나 선택합니다.

    • Google Cloud 프로젝트를 만듭니다.

      gcloud projects create PROJECT_ID

      PROJECT_ID를 만들려는 Google Cloud 프로젝트의 이름으로 바꿉니다.

    • 만든 Google Cloud 프로젝트를 선택합니다.

      gcloud config set project PROJECT_ID

      PROJECT_ID를 Google Cloud 프로젝트 이름으로 바꿉니다.

  10. Google Cloud 프로젝트에 결제가 사용 설정되어 있는지 확인합니다.

  11. Cloud Storage, Translation, and Workflows API를 사용 설정합니다.

    gcloud services enable storage.googleapis.com translate.googleapis.com workflows.googleapis.com
  12. gcloud 구성요소를 업데이트합니다.
    gcloud components update
  13. 계정을 사용하여 로그인합니다.
    gcloud auth login
  14. 이 튜토리얼에서 사용한 기본 위치를 설정합니다.
    gcloud config set workflows/location us-central1
    

    이 튜토리얼에서는 us-central1에 있는 기본 AutoML Translation 모델을 사용하므로 위치를 us-central1로 설정해야 합니다.

    기본값이 아닌 AutoML Translation 모델 또는 용어를 사용하는 경우 커넥터에 대한 호출과 동일한 위치에 있어야 합니다. 그렇지 않으면 INVALID_ARGUMENT (400) 오류가 반환됩니다. 자세한 내용은 batchTranslateText 메서드를 참조하세요.

입력 Cloud Storage 버킷 및 파일 만들기

Cloud Storage를 사용하여 객체를 저장할 수 있습니다. 객체는 모든 형식의 파일로 구성된 변경할 수 없는 데이터 조각이며 버킷이라고 하는 컨테이너에 저장됩니다.

  1. 번역할 파일을 저장할 Cloud Storage 버킷을 만듭니다.

    BUCKET_INPUT=${GOOGLE_CLOUD_PROJECT}-input-files
    gsutil mb gs://${BUCKET_INPUT}
  2. 영어로 파일 2개를 만들어 입력 버킷에 업로드합니다.

    echo "Hello World!" > file1.txt
    gsutil cp file1.txt gs://${BUCKET_INPUT}
    echo "Workflows connectors simplify calling services." > file2.txt
    gsutil cp file2.txt gs://${BUCKET_INPUT}

워크플로 배포 및 실행

워크플로 정의는 YAML 또는 JSON 형식으로 작성할 수 있는 Workflows 구문을 사용하여 기술되는 일련의 단계들로 구성됩니다. 이것이 워크플로의 정의입니다. 워크플로를 만든 후 실행에 사용할 수 있도록 워크플로를 배포합니다.

  1. 다음 콘텐츠가 포함된 파일 이름이 workflow.yaml인 텍스트 파일을 만듭니다.

    main:
      steps:
      - init:
          assign:
          - projectId: ${sys.get_env("GOOGLE_CLOUD_PROJECT_ID")}
          - location: ${sys.get_env("GOOGLE_CLOUD_LOCATION")}
          - inputBucketName: ${projectId + "-input-files"}
          - outputBucketName: ${projectId + "-output-files-" + string(int(sys.now()))}
      - createOutputBucket:
            call: googleapis.storage.v1.buckets.insert
            args:
              project: ${projectId}
              body:
                name: ${outputBucketName}
      - batchTranslateText:
          call: googleapis.translate.v3beta1.projects.locations.batchTranslateText
          args:
              parent: ${"projects/" + projectId + "/locations/" + location}
              body:
                  inputConfigs:
                    gcsSource:
                      inputUri: ${"gs://" + inputBucketName + "/*"}
                  outputConfig:
                      gcsDestination:
                        outputUriPrefix: ${"gs://" + outputBucketName + "/"}
                  sourceLanguageCode: "en"
                  targetLanguageCodes: ["es", "fr"]
          result: batchTranslateTextResult

    이 워크플로는 변수를 할당하고 출력 버킷을 만든 다음 파일 번역을 시작하여 결과를 출력 버킷에 저장합니다.

  2. 워크플로를 만든 후 배포합니다.

    gcloud workflows deploy batch-translation --source=workflow.yaml
  3. 워크플로를 실행합니다.

    gcloud workflows execute batch-translation
  4. 워크플로 상태를 보려면 반환된 명령어를 실행하면 됩니다. 예를 들면 다음과 같습니다.

    gcloud workflows executions describe eb4a6239-cffa-4672-81d8-d4caef7d8424 /
      --workflow batch-translation /
      --location us-central1

    워크플로는 ACTIVE여야 합니다. 몇 분 후 번역된 파일(프랑스어 및 스페인어)이 출력 버킷에 업로드됩니다.

출력 버킷의 객체 나열

출력 버킷의 객체를 나열하여 워크플로가 예상대로 작동하는지 확인할 수 있습니다.

  1. 출력 버킷 이름을 검색합니다.

    gsutil ls

    출력은 다음과 비슷합니다.

    gs://PROJECT_ID-input-files/
    gs://PROJECT_ID-output-files-TIMESTAMP/

  2. 출력 버킷의 객체 나열

    gsutil ls -r gs://PROJECT_ID-output-files-TIMESTAMP/**

    몇 분 후 프랑스어와 스페인어로 번역된 파일 두 개가 나열됩니다.

삭제

이 튜토리얼용으로 새 프로젝트를 만든 경우 이 프로젝트를 삭제합니다. 기존 프로젝트를 사용한 경우 이 튜토리얼에 추가된 변경사항은 제외하고 보존하려면 튜토리얼용으로 만든 리소스를 삭제합니다.

프로젝트 삭제

비용이 청구되지 않도록 하는 가장 쉬운 방법은 튜토리얼에서 만든 프로젝트를 삭제하는 것입니다.

프로젝트를 삭제하려면 다음 안내를 따르세요.

  1. Google Cloud 콘솔에서 리소스 관리 페이지로 이동합니다.

    리소스 관리로 이동

  2. 프로젝트 목록에서 삭제할 프로젝트를 선택하고 삭제를 클릭합니다.
  3. 대화상자에서 프로젝트 ID를 입력한 후 종료를 클릭하여 프로젝트를 삭제합니다.

가이드 리소스 삭제

  1. 튜토리얼 설정 중에 추가한 gcloud 기본 구성을 삭제합니다.

    gcloud config unset workflows/location
    
  2. 이 튜토리얼에서 만든 워크플로를 삭제합니다.

    gcloud workflows delete WORKFLOW_NAME
    
  3. 이 튜토리얼에서 만든 버킷을 삭제합니다.

    gsutil rm -r gs://BUCKET_NAME

    여기서 BUCKET_NAME은 삭제할 버킷의 이름입니다. my-bucket).

    응답은 다음 예시와 유사합니다.

    Removing gs://my-bucket/...

다음 단계