Hello 텍스트 데이터: 텍스트 분류 데이터 세트 만들기 및 문서 가져오기

Vertex AI 콘솔을 사용하여 텍스트 분류 데이터 세트를 만듭니다. 데이터 세트가 생성된 후 Cloud Storage 버킷으로 복사한 CSV를 사용하여 해당 문서를 데이터 세트로 가져옵니다.

이 가이드는 여러 페이지로 이루어져 있습니다.

  1. 프로젝트 및 환경 설정

  2. 텍스트 분류 데이터 세트 만들기

  3. AutoML 텍스트 분류 모델 학습

  4. 엔드포인트에 모델을 배포하고 예측 전송

  5. 프로젝트 삭제

각 페이지에서는 이 가이드의 이전 페이지에서 안내를 이미 수행했다고 가정합니다.

  1. Vertex AI 콘솔로 이동합니다.

  2. Vertex AI 시작하기 페이지에서 데이터 세트 만들기를 클릭합니다.

    Vertex AI 대시보드

  3. 데이터 세트에 대한 세부정보를 지정합니다.

    1. 데이터 세트 이름을 지정합니다(예: text_classification_tutorial).

    2. 데이터 유형 및 목표 선택 섹션에서 텍스트를 클릭한 후 텍스트 분류(단일 라벨)를 선택합니다.

    3. 리전에서 us-central1을 선택합니다.

      이 가이드에서는 us-central1을 사용하지만 Vertex AI는 europe-west4와 같은 다른 리전을 지원합니다.

    4. 만들기를 클릭하여 빈 데이터 세트를 만든 후 문서를 가져옵니다.

      새 데이터 세트 창

  4. 가져오기 페이지에서 Cloud Storage에서 가져오기 파일 선택을 선택하고 CSV 파일의 Cloud Storage 위치를 지정합니다.

    이 가이드에서 CSV 파일은 gs://${BUCKET}/text/happiness.csv에 있습니다. 이 가이드의 버킷은 데이터 세트와 동일한 리전에 있지만 모든 리전의 버킷에 있는 파일을 지정할 수 있습니다.

    파일 가져오기 선택 창

  5. 자동 데이터 분할을 유지합니다.

    Vertex AI는 학습, 검증, 테스트 세트에 문서를 자동으로 할당합니다. 자세한 내용은 AutoML 모델의 데이터 분할 정보를 참조하세요.

  6. 계속을 클릭하여 가져오기를 시작합니다.

    가져오기 프로세스는 몇 분 정도 걸립니다. 가져오기가 완료되면 데이터 세트의 찾아보기 탭에서 가져온 모든 문서와 관련 라벨을 탐색할 수 있습니다.

다음 단계

이 가이드의 다음 페이지를 따라 AutoML 모델 학습 작업을 시작합니다.