Console을 사용하여 데이터 세트 만들기

머신러닝 모델을 만들려면 우선 학습할 대표 데이터 모음이 있어야 합니다. Console(또는 API)을 사용하여 빈 데이터 세트를 만들고 데이터 세트로 데이터를 가져옵니다. 데이터를 가져온 후 적절히 수정하여 모델 학습을 시작할 수 있습니다.

특정 데이터 유형 및 목표의 가져오기 파일 형식에 대한 자세한 내용은 다음 페이지를 참조하세요.

데이터 세트 만들기 및 데이터 가져오기 또는 연결

다음 안내에 따라 빈 데이터 세트를 만들고 데이터를 가져오거나 연결합니다.

이미지

  1. Google Cloud Console의 Vertex AI 섹션에서 데이터 세트 페이지로 이동합니다.

    데이터 세트 페이지로 이동

  2. 만들기를 클릭하여 데이터 세트 만들기 세부정보 페이지를 엽니다.
  3. 데이터 세트 이름 필드를 수정하여 데이터 세트를 설명하는 표시 이름을 지정합니다.
  4. 데이터 유형에 해당하는 탭을 선택합니다.
    데이터 유형 선택
  5. 데이터 유형을 선택한 후에 모델의 목표를 선택합니다. 목표 옵션은 선택한 데이터 유형에 따라 다릅니다.
  6. 리전 드롭다운 목록에서 리전을 선택합니다.
  7. 만들기를 클릭하여 빈 데이터 세트를 만들고 데이터 가져오기 페이지로 이동합니다.
  8. 가져오기 방법 선택 섹션에서 다음 옵션 중 하나를 선택합니다.

    컴퓨터에서 데이터 업로드

    1. 가져오기 방법 선택 섹션에서 컴퓨터의 데이터를 업로드하도록 선택합니다.
    2. 파일 선택을 클릭하고 Cloud Storage 버킷에 업로드할 모든 로컬 파일을 선택합니다.
    3. Cloud Storage 경로 선택 섹션에서 탐색을 클릭하여 데이터를 업로드할 Cloud Storage 버킷 위치를 선택합니다.

    컴퓨터에서 가져오기 파일 업로드

    1. 컴퓨터에서 가져오기 파일 업로드를 클릭합니다.
    2. 파일 선택을 클릭하고 Cloud Storage 버킷에 업로드할 로컬 가져오기 파일을 선택합니다.
    3. Cloud Storage 경로 선택 섹션에서 탐색을 클릭하여 파일을 업로드할 Cloud Storage 버킷 위치를 선택합니다.

    Cloud Storage에서 가져오기 파일 선택

    1. Cloud Storage에서 가져오기 파일 선택을 클릭합니다.
    2. Cloud Storage 경로 선택 섹션에서 탐색을 클릭하여 Cloud Storage에서 가져오기 파일을 선택합니다.
  9. 계속을 클릭합니다.

    데이터 크기에 따라 몇 시간이 소요될 수 있습니다. 탭을 닫았다가 나중에 다시 돌아와도 됩니다. 데이터를 가져오면 이메일이 전송됩니다.

테이블 형식

  1. Google Cloud Console의 Vertex AI 섹션에서 데이터 세트 페이지로 이동합니다.

    데이터 세트 페이지로 이동

  2. 만들기를 클릭하여 데이터 세트 만들기 세부정보 페이지를 엽니다.
  3. 데이터 세트 이름 필드를 수정하여 데이터 세트를 설명하는 표시 이름을 지정합니다.
  4. 표 형식 탭을 선택합니다.
  5. 목표(모델 유형)를 선택합니다.
  6. 리전 드롭다운 목록에서 리전을 선택합니다.
  7. 데이터 세트에서 고객 관리 암호화 키(CMEK)를 사용하려면 고급 옵션을 열고 키를 입력합니다. (미리보기)
  8. 만들기를 클릭하여 빈 데이터 세트를 만들고 소스 탭으로 이동합니다.
  9. 데이터 소스에 따라 다음 옵션 중 하나를 선택합니다.

    컴퓨터의 CSV 파일

    1. 컴퓨터에서 CSV 파일 업로드를 클릭합니다.
    2. 파일 선택을 클릭하고 Cloud Storage 버킷에 업로드할 모든 로컬 파일을 선택합니다.
    3. Cloud Storage 경로 선택 섹션에서 Cloud Storage 버킷 경로를 입력하거나 탐색을 클릭하여 버킷 위치를 선택합니다.

    Cloud Storage의 CSV 파일

    1. Cloud Storage에서 CSV 파일 선택을 클릭합니다.
    2. Cloud Storage에서 CSV 파일 선택 섹션에서 Cloud Storage 버킷 경로를 입력하거나 탐색을 클릭하여 CSV 파일의 위치를 선택합니다.

    BigQuery의 테이블 또는 뷰

    1. BigQuery에서 테이블 또는 뷰 선택을 클릭합니다.
    2. 입력 파일의 프로젝트, 데이터 세트, 테이블 ID를 입력합니다.
  10. 계속을 클릭합니다.

    데이터 소스가 데이터 세트와 연결되어 있습니다.

  11. 예측 모델의 경우 분석 탭에서 이 데이터 세트의 시간 열과 시계열 식별자 열을 지정합니다.

    모델을 학습시킬 때 이러한 열을 지정할 수도 있지만 일반적으로 예측 데이터 세트(미리보기)에 특정 시간 및 시계열 식별자 열이 있으므로 데이터 세트에서 지정하는 것이 좋습니다.

텍스트

  1. Google Cloud Console의 Vertex AI 섹션에서 데이터 세트 페이지로 이동합니다.

    데이터 세트 페이지로 이동

  2. 만들기를 클릭하여 데이터 세트 만들기 세부정보 페이지를 엽니다.
  3. 데이터 세트 이름 필드를 수정하여 데이터 세트를 설명하는 표시 이름을 지정합니다.
  4. 데이터 유형에 해당하는 탭을 선택합니다.
    데이터 유형 선택
  5. 데이터 유형을 선택한 후에 모델의 목표를 선택합니다. 목표 옵션은 선택한 데이터 유형에 따라 다릅니다.
  6. 리전 드롭다운 목록에서 리전을 선택합니다.
  7. 만들기를 클릭하여 빈 데이터 세트를 만들고 데이터 가져오기 페이지로 이동합니다.
  8. 가져오기 방법 선택 섹션에서 다음 옵션 중 하나를 선택합니다.

    컴퓨터에서 데이터 업로드

    1. 가져오기 방법 선택 섹션에서 컴퓨터의 데이터를 업로드하도록 선택합니다.
    2. 파일 선택을 클릭하고 Cloud Storage 버킷에 업로드할 모든 로컬 파일을 선택합니다.
    3. Cloud Storage 경로 선택 섹션에서 탐색을 클릭하여 데이터를 업로드할 Cloud Storage 버킷 위치를 선택합니다.

    컴퓨터에서 가져오기 파일 업로드

    1. 컴퓨터에서 가져오기 파일 업로드를 클릭합니다.
    2. 파일 선택을 클릭하고 Cloud Storage 버킷에 업로드할 로컬 가져오기 파일을 선택합니다.
    3. Cloud Storage 경로 선택 섹션에서 탐색을 클릭하여 파일을 업로드할 Cloud Storage 버킷 위치를 선택합니다.

    Cloud Storage에서 가져오기 파일 선택

    1. Cloud Storage에서 가져오기 파일 선택을 클릭합니다.
    2. Cloud Storage 경로 선택 섹션에서 탐색을 클릭하여 Cloud Storage에서 가져오기 파일을 선택합니다.
  9. 계속을 클릭합니다.

    데이터 크기에 따라 몇 시간이 소요될 수 있습니다. 탭을 닫았다가 나중에 다시 돌아와도 됩니다. 데이터를 가져오면 이메일이 전송됩니다.

동영상

  1. Google Cloud Console의 Vertex AI 섹션에서 데이터 세트 페이지로 이동합니다.

    데이터 세트 페이지로 이동

  2. 만들기를 클릭하여 데이터 세트 만들기 세부정보 페이지를 엽니다.
  3. 데이터 세트 이름 필드를 수정하여 데이터 세트를 설명하는 표시 이름을 지정합니다.
  4. 데이터 유형에 해당하는 탭을 선택합니다.
    데이터 유형 선택
  5. 데이터 유형을 선택한 후에 모델의 목표를 선택합니다. 목표 옵션은 선택한 데이터 유형에 따라 다릅니다.
  6. 리전 드롭다운 목록에서 리전을 선택합니다.
  7. 만들기를 클릭하여 빈 데이터 세트를 만들고 데이터 가져오기 페이지로 이동합니다.
  8. 가져오기 방법 선택 섹션에서 다음 옵션 중 하나를 선택합니다.

    컴퓨터에서 데이터 업로드

    1. 가져오기 방법 선택 섹션에서 컴퓨터의 데이터를 업로드하도록 선택합니다.
    2. 파일 선택을 클릭하고 Cloud Storage 버킷에 업로드할 모든 로컬 파일을 선택합니다.
    3. Cloud Storage 경로 선택 섹션에서 탐색을 클릭하여 데이터를 업로드할 Cloud Storage 버킷 위치를 선택합니다.

    컴퓨터에서 가져오기 파일 업로드

    1. 컴퓨터에서 가져오기 파일 업로드를 클릭합니다.
    2. 파일 선택을 클릭하고 Cloud Storage 버킷에 업로드할 로컬 가져오기 파일을 선택합니다.
    3. Cloud Storage 경로 선택 섹션에서 탐색을 클릭하여 파일을 업로드할 Cloud Storage 버킷 위치를 선택합니다.

    Cloud Storage에서 가져오기 파일 선택

    1. Cloud Storage에서 가져오기 파일 선택을 클릭합니다.
    2. Cloud Storage 경로 선택 섹션에서 탐색을 클릭하여 Cloud Storage에서 가져오기 파일을 선택합니다.
  9. 계속을 클릭합니다.

    데이터 크기에 따라 몇 시간이 소요될 수 있습니다. 탭을 닫았다가 나중에 다시 돌아와도 됩니다. 데이터를 가져오면 이메일이 전송됩니다.

다음 단계