Hello 텍스트 데이터: 프로젝트 및 환경 설정

Python용 Vertex AI SDK를 사용하려는 경우 클라이언트를 초기화하는 서비스 계정에 Vertex AI 서비스 에이전트(roles/aiplatform.serviceAgent) IAM 역할이 있는지 확인합니다.

튜토리얼의 이 부분에서는 AutoML 모델을 학습시키는 데 필요한 문서가 포함된 Vertex AI 및 Cloud Storage 버킷을 사용하기 위해 Google Cloud 프로젝트를 설정하게 됩니다.

이 튜토리얼은 여러 페이지로 이루어져 있습니다.

  1. 프로젝트 및 환경 설정

  2. 텍스트 분류 데이터 세트 만들기

  3. AutoML 텍스트 분류 모델 학습

  4. 엔드포인트에 모델을 배포하고 예측 전송

  5. 프로젝트 삭제

각 페이지에서는 이 튜토리얼의 이전 페이지에서 안내를 이미 수행했다고 가정합니다.

프로젝트 및 환경 설정

Vertex AI 기능을 사용하려면 다음 단계를 완료합니다.

  1. In the Google Cloud console, go to the project selector page.

    Go to project selector

  2. Select or create a Google Cloud project.

  3. Google Cloud 프로젝트에 결제가 사용 설정되어 있는지 확인합니다.

  4. Cloud Shell을 엽니다. Cloud Shell은 웹브라우저에서 프로젝트와 리소스를 관리할 수 있는 Google Cloud의 대화형 셸 환경입니다.
  5. Cloud Shell로 이동
  6. Cloud Shell에서 현재 프로젝트를 Google Cloud 프로젝트 ID로 설정하고 이를 projectid 셸 변수에 저장합니다.
      gcloud config set project PROJECT_ID &&
      projectid=PROJECT_ID &&
      echo $projectid
    PROJECT_ID를 프로젝트 ID로 바꿉니다. Google Cloud 콘솔에서 프로젝트 ID를 찾을 수 있습니다. 자세한 내용은 프로젝트 ID 찾기를 참조하세요.
  7. Enable the IAM, Compute Engine, Notebooks, Cloud Storage, and Vertex AI APIs:

    gcloud services enable iam.googleapis.com  compute.googleapis.com notebooks.googleapis.com storage.googleapis.com aiplatform.googleapis.com
  8. Google 계정에 역할을 부여합니다. 다음 각 IAM 역할에 대해 다음 명령어를 한 번씩 실행합니다. roles/aiplatform.user, roles/storage.admin

    gcloud projects add-iam-policy-binding PROJECT_ID --member="user:EMAIL_ADDRESS" --role=ROLE
    • PROJECT_ID를 프로젝트 ID로 바꿉니다.
    • EMAIL_ADDRESS를 이메일 주소로 바꿉니다.
    • ROLE을 각 개별 역할로 바꿉니다.
  9. Vertex AI 사용자(roles/aiplatform.user) IAM 역할은 Vertex AI의 모든 리소스를 사용할 수 있는 액세스 권한을 제공합니다. 스토리지 관리자(roles/storage.admin) 역할을 통해 Cloud Storage에 문서의 학습 데이터 세트를 저장할 수 있습니다.

Cloud Storage 버킷 만들기 및 샘플 데이터 세트 복사

AutoML 모델 학습에 사용할 문서 저장용 Cloud Storage 버킷을 만듭니다.

  1. Cloud Shell을 엽니다.

  2. PROJECT_ID 변수를 프로젝트의 ID로 설정합니다.

    export PROJECT_ID=PROJECT_ID
  3. Cloud Storage 버킷을 생성하는 데 사용할 BUCKET 변수를 설정합니다.

    export BUCKET=${PROJECT_ID}-lcm
  4. BUCKET 변수를 사용하여 us-central1 리전에 Cloud Storage 버킷을 만듭니다.

    gsutil mb -p ${PROJECT_ID} -l us-central1 gs://${BUCKET}/
  5. happiness.csv 샘플 학습 데이터 세트를 버킷에 복사합니다.

    gsutil -m cp -R gs://cloud-ml-data/NL-classification/happiness.csv gs://${BUCKET}/text/

다음 단계

이 튜토리얼의 다음 페이지를 따라 Vertex AI 콘솔을 사용하여 텍스트 분류 데이터 세트를 생성하고 Cloud Storage 버킷에 복사한 문서를 가져옵니다.