AI Platform Pipelines를 사용하면 머신러닝(ML) 워크플로를 재사용 및 재현 가능한 파이프라인으로 조정할 수 있습니다. AI Platform Pipelines는 Google Kubernetes Engine의 TensorFlow Extended로 Kubeflow Pipelines를 설정하는 어려움을 줄입니다.
이 가이드에서는 GKE에 AI Platform Pipelines 배포의 몇 가지 옵션을 설명합니다. 기존 GKE 클러스터에 Kubeflow Pipelines를 배포하거나 새 GKE 클러스터를 만들 수 있습니다. 기존 GKE 클러스터를 다시 사용하려면 클러스터가 다음 요구사항을 충족하는지 확인합니다.
- 클러스터에 노드가 3개 이상 있어야 합니다. 각 노드에는 최소 2개의 CPU와 4GB의 메모리가 있어야 합니다.
- 클러스터의 액세스 범위는 모든 Cloud APIs에 대한 전체 액세스 권한이 부여되거나 클러스터가 커스텀 서비스 계정을 사용해야 합니다.
- 클러스터에 아직 Kubeflow Pipelines가 설치되지 않은 상태여야 합니다.
상황에 가장 적합한 배포 옵션을 선택합니다.
- AI Platform 파이프라인을 사용하여 Google Cloud에 대한 전체 액세스 권한이 있는 새 GKE 클러스터를 만들고 Kubeflow Pipelines를 클러스터에 배포합니다. 이 옵션을 사용하면 AI Platform 파이프라인을 더 쉽게 배포하고 사용할 수 있습니다.
- Google Cloud에 세분화된 액세스 권한이 있는 새 GKE 클러스터를 만들고 이 클러스터에 Kubeflow Pipelines를 배포합니다. 이 옵션을 사용하면 클러스터의 워크로드가 액세스할 수 있는 Google Cloud 리소스와 API를 지정할 수 있습니다.
- 기존 GKE 클러스터에 AI Platform 파이프라인을 배포합니다. 이 옵션은 AI Platform 파이프라인을 기존 GKE 클러스터에 배포하는 방법을 설명합니다.
시작하기 전에
이 가이드를 따르기 전에 Google Cloud 프로젝트가 올바르게 설정되어 있고 AI Platform 파이프라인을 배포할 충분한 권한이 있는지 확인하세요.- Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Make sure that billing is enabled for your Google Cloud project.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Make sure that billing is enabled for your Google Cloud project.
- 다음 안내에 따라 AI Platform 파이프라인을 배포하는 데 필요한 역할이 부여되었는지 확인합니다.
-
Cloud Shell 세션을 엽니다.
Cloud Shell이 Google Cloud 콘솔 하단의 프레임에 열립니다.
-
AI Platform 파이프라인을 배포하려면 프로젝트에 대해 뷰어(
roles/viewer
) 및 Kubernetes Engine 관리자(roles/container.admin
) 역할이 있거나, 프로젝트에 대해 소유자(roles/owner
) 역할과 동일한 권한이 포함된 역할이 있어야 합니다. Cloud Shell에서 다음 명령어를 실행하여 뷰어 및 Kubernetes Engine 관리자 역할이 있는 주 구성원을 나열합니다.gcloud projects get-iam-policy PROJECT_ID \ --flatten="bindings[].members" --format="table(bindings.role, bindings.members)" \ --filter="bindings.role:roles/container.admin OR bindings.role:roles/viewer"
PROJECT_ID를 Google Cloud 프로젝트의 ID로 바꿉니다.
이 명령어의 출력을 사용하여 계정에 뷰어 및 Kubernetes Engine 관리자 역할이 있는지 확인합니다.
-
클러스터에 세분화된 액세스 권한을 부여하려면 프로젝트에 대한 서비스 계정 관리자(
roles/iam.serviceAccountAdmin
) 역할이나 프로젝트에서 편집자(roles/editor
) 또는 소유자(roles/owner
) 역할과 같은 동등한 권한이 포함된 다른 역할이 있어야 합니다. Cloud Shell에서 다음 명령어를 실행하여 서비스 계정 관리자 역할이 있는 주 구성원을 나열합니다.gcloud projects get-iam-policy PROJECT_ID \ --flatten="bindings[].members" --format="table(bindings.role, bindings.members)" \ --filter="bindings.role:roles/iam.serviceAccountAdmin"
PROJECT_ID를 Google Cloud 프로젝트의 ID로 바꿉니다.
이 명령어의 출력에서 계정에 서비스 계정 관리자 역할이 있는지 확인합니다.
-
필요한 역할이 부여되지 않은 경우 Google Cloud 프로젝트 관리자에게 도움을 요청합니다.
ID 및 액세스 관리 역할 부여에 대해 자세히 알아보세요.
-
Google Cloud에 대한 전체 액세스 권한으로 AI Platform 파이프라인 배포
AI Platform 파이프라인을 사용하면 GKE 클러스터를 만들고 Kubeflow Pipelines를 클러스터에 배포하여 Kubeflow Pipelines를 더 쉽게 설정 및 사용할 수 있습니다. AI Platform 파이프라인이 GKE 클러스터를 만들면 이 클러스터는 기본 Compute Engine 서비스 계정을 사용합니다. 프로젝트에서 사용 설정한 Google Cloud 리소스 및 API에 대한 전체 액세스 권한을 클러스터에 제공하려면 https://www.googleapis.com/auth/cloud-platform
액세스 범위에 클러스터 액세스 권한을 부여하면 됩니다. 이러한 방식으로 액세스 권한을 부여하면 클러스터에서 실행되는 ML 파이프라인이 AI Platform Training 및 AI Platform Prediction과 같은 Google Cloud APIs에 액세스할 수 있습니다. 이 프로세스를 통하면 AI Platform 파이프라인을 더 쉽게 설정할 수 있지만 파이프라인 개발자에게 Google Cloud 리소스 및 API에 대한 과도한 액세스 권한이 부여될 수 있습니다.
다음 안내에 따라 Google Cloud 리소스 및 API에 대한 전체 액세스 권한이 있는 AI Platform 파이프라인을 배포합니다.
Google Cloud 콘솔에서 AI Platform 파이프라인을 엽니다.
AI Platform Pipelines 툴바에서 새 인스턴스를 클릭합니다. Google Cloud Marketplace에서 Kubeflow Pipelines가 열립니다.
구성을 클릭합니다. Kubeflow Pipelines 배포 양식이 열립니다.
새 클러스터 만들기 링크가 표시되면 새 클러스터 만들기를 클릭합니다. 이러한 경우가 아니면 계속해서 다음 단계를 진행합니다.
클러스터가 위치해야 하는 클러스터 영역을 선택합니다. 사용할 영역을 결정하는 방법은 리전 선택 권장사항을 참조하세요.
다음 Cloud API에 대한 액세스 허용을 선택하여 GKE 클러스터에서 실행되는 애플리케이션에 Google Cloud 리소스 액세스 권한을 부여합니다. 이 체크박스를 선택하여
https://www.googleapis.com/auth/cloud-platform
액세스 범위에 대한 액세스 권한을 클러스터에 부여합니다. 이 액세스 범위는 프로젝트에서 사용 설정한 Google Cloud 리소스에 대한 전체 액세스 권한을 제공합니다. 이러한 방식으로 클러스터에 Google Cloud 리소스에 대한 액세스 권한을 부여하면 서비스 계정을 만들고 관리하거나 Kubernetes 보안 비밀을 만드는 데 도움이 됩니다.클러스터 생성을 클릭합니다. 이 단계는 몇 분 정도 걸릴 수 있습니다.
네임스페이스는 대규모 GKE 클러스터에서 리소스 관리를 위해 사용됩니다. 클러스터에서 네임스페이스를 사용하지 않으려면 네임스페이스 드롭다운 목록에서 기본을 선택합니다.
GKE 클러스터에서 네임스페이스를 사용하려는 경우 네임스페이스 드롭다운 목록을 사용하여 네임스페이스를 만듭니다. 네임스페이스를 만들려면 다음 안내를 따르세요.
- 네임스페이스 드롭다운 목록에서 네임스페이스 만들기를 선택합니다. 새 네임스페이스 이름 상자가 나타납니다.
- 새 네임스페이스 이름에 네임스페이스 이름을 입력합니다.
네임스페이스에 대해 자세히 알아 보려면 네임스페이스로 Kubernetes 구성에 대한 블로그 게시물을 읽어보세요.
앱 인스턴스 이름 입력란에 Kubeflow Pipelines 인스턴스의 이름을 입력합니다.
관리형 스토리지를 사용하면 ML 파이프라인의 메타데이터와 아티팩트를 Compute Engine 영구 디스크에 저장하는 대신 Cloud SQL과 Cloud Storage를 사용하여 저장할 수 있습니다. 관리형 서비스를 사용하여 파이프라인 아티팩트와 메타데이터를 저장하면 간편하게 클러스터의 데이터를 백업 및 복원할 수 있습니다. 관리형 스토리지를 사용하여 Kubeflow Pipelines를 배포하려면 관리형 스토리지 사용을 선택하고 다음 정보를 제공합니다.
아티팩트 스토리지 Cloud Storage 버킷: 관리형 스토리지를 사용하면 Kubeflow Pipelines에서 파이프라인 아티팩트를 Cloud Storage 버킷에 저장합니다. Kubeflow Pipelines에서 아티팩트를 저장할 버킷의 이름을 지정합니다. 지정된 버킷이 없으면 Kubeflow Pipelines 배포자가 자동으로
us-central1
리전에 버킷을 만듭니다.Cloud SQL 인스턴스 연결 이름: 관리형 스토리지를 사용하면 Kubeflow Pipelines에서 파이프라인 메타데이터를 Cloud SQL의 MySQL 데이터베이스에 저장합니다. Cloud SQL MySQL 인스턴스의 연결 이름을 지정합니다.
데이터베이스 사용자 이름: MySQL 인스턴스에 연결하는 경우 사용할 Kubeflow Pipelines의 데이터베이스 사용자 이름을 지정합니다. 현재 데이터베이스 사용자에게 관리형 스토리지로 Kubeflow Pipelines를 배포할 수 있는
ALL
MySQL 권한이 있어야 합니다. 이 필드를 비워두면 기본값이 root로 설정됩니다.데이터베이스 비밀번호: MySQL 인스턴스에 연결하는 경우 사용할 Kubeflow Pipelines의 데이터베이스 비밀번호를 지정합니다. 이 필드를 비워두면 Kubeflow Pipelines가 비밀번호를 제공하지 않고 데이터베이스에 연결하므로 지정한 사용자 이름에 비밀번호가 필요할 때 실패합니다.
데이터베이스 이름 프리픽스: 데이터베이스 이름 프리픽스를 지정합니다. 프리픽스 값은 문자로 시작해야 하며 소문자, 숫자, 밑줄만 사용할 수 있습니다.
배포 프로세스 중에 Kubeflow Pipelines는 'DATABASE_NAME_PREFIX_pipeline' 및 'DATABASE_NAME_PREFIX_metadata' 등 데이터베이스 두 개를 만듭니다. 이러한 이름의 데이터베이스가 MySQL 인스턴스에 있으면 Kubeflow Pipelines는 기존 데이터베이스를 다시 사용합니다. 이 값을 지정하지 않으면 앱 인스턴스 이름이 데이터베이스 이름 프리픽스로 사용됩니다.
배포를 클릭합니다. 이 단계를 완료하는 데 몇 분 정도 걸릴 수 있습니다.
파이프라인 대시보드에 액세스하려면 Google Cloud 콘솔에서 AI Platform 파이프라인을 엽니다.
그런 다음 AI Platform 파이프라인 인스턴스의 파이프라인 대시보드 열기를 클릭합니다.
Google Cloud에 대한 세부적인 액세스 권한으로 AI Platform 파이프라인 배포
ML 파이프라인은 GKE 클러스터 노드 풀의 서비스 계정 및 액세스 범위를 사용하여 Google Cloud 리소스에 액세스합니다. 현재 특정 Google Cloud 리소스에 대한 클러스터의 액세스를 제한하려면 사용자 관리형 서비스 계정을 사용하는 GKE 클러스터에 AI Platform 파이프라인을 배포해야 합니다.
다음 섹션의 안내에 따라 서비스 계정을 만들고 구성하고, 서비스 계정을 사용하여 GKE 클러스터를 만들고, GKE 클러스터에 Kubeflow Pipelines를 배포합니다.
GKE 클러스터의 서비스 계정 만들기
다음 안내에 따라 GKE 클러스터의 서비스 계정을 설정합니다.
Cloud Shell 세션을 엽니다.
Cloud Shell이 Google Cloud 콘솔 하단의 프레임에 열립니다.
Cloud Shell에서 다음 명령어를 실행하여 서비스 계정을 만들고 AI Platform 파이프라인을 실행할 수 있는 충분한 액세스 권한을 부여합니다. 사용자 관리형 서비스 계정으로 AI Platform 파이프라인을 실행하는 데 필요한 역할을 자세히 알아보세요.
export PROJECT=PROJECT_ID
export SERVICE_ACCOUNT=SERVICE_ACCOUNT_NAME
gcloud iam service-accounts create $SERVICE_ACCOUNT \ --display-name=$SERVICE_ACCOUNT \ --project=$PROJECT
gcloud projects add-iam-policy-binding $PROJECT \ --member="serviceAccount:$SERVICE_ACCOUNT@$PROJECT.iam.gserviceaccount.com" \ --role=roles/logging.logWriter
gcloud projects add-iam-policy-binding $PROJECT \ --member="serviceAccount:$SERVICE_ACCOUNT@$PROJECT.iam.gserviceaccount.com" \ --role=roles/monitoring.metricWriter
gcloud projects add-iam-policy-binding $PROJECT \ --member="serviceAccount:$SERVICE_ACCOUNT@$PROJECT.iam.gserviceaccount.com" \ --role=roles/monitoring.viewer
gcloud projects add-iam-policy-binding $PROJECT \ --member="serviceAccount:$SERVICE_ACCOUNT@$PROJECT.iam.gserviceaccount.com" \ --role=roles/storage.objectViewer
다음을 바꿉니다.
- SERVICE_ACCOUNT_NAME: 만들 서비스 계정의 이름입니다.
- PROJECT_ID: 서비스 계정이 생성된 Google Cloud 프로젝트입니다.
ML 파이프라인에 필요한 모든 Google Cloud 리소스 또는 API에 대한 액세스 권한을 서비스 계정에 부여합니다. ID 및 액세스 관리 역할 및 서비스 계정 관리에 대해 자세히 알아보세요.
사용자 계정에 서비스 계정에 대한 서비스 계정 사용자(
iam.serviceAccountUser
) 역할을 부여합니다.gcloud iam service-accounts add-iam-policy-binding \ "SERVICE_ACCOUNT_NAME@PROJECT_ID.iam.gserviceaccount.com" \ --member=user:USERNAME \ --role=roles/iam.serviceAccountUser
다음을 바꿉니다.
- SERVICE_ACCOUNT_NAME: 서비스 계정의 이름입니다.
- PROJECT_ID: Google Cloud 프로젝트입니다.
- USERNAME: Google Cloud의 사용자 이름입니다.
GKE 클러스터 설정
다음 안내에 따라 GKE 클러스터를 설정합니다.
Google Cloud 콘솔에서 Google Kubernetes Engine을 엽니다.
클러스터 만들기 버튼을 클릭합니다. 클러스터 기본사항 양식이 열립니다.
클러스터의 이름을 입력합니다.
위치 유형에서 영역을 선택한 후 클러스터에 사용할 영역을 선택합니다. 사용할 영역을 결정하는 방법은 리전 선택 권장사항을 참조하세요.
탐색창의 노드 풀에서 default-pool을 클릭합니다. 노드 풀 세부정보 양식이 표시됩니다.
클러스터에서 만들 노드 수를 입력합니다. AI Platform 파이프라인을 배포하려면 클러스터에 노드가 3개 이상 있어야 합니다. 노드 및 해당 리소스(예: 방화벽 경로)에 사용 가능한 리소스 할당량이 있어야 합니다.
탐색창의 노드 풀에서 노드를 클릭합니다. 노드 양식이 열립니다.
인스턴스에 사용할 기본 머신 구성을 선택합니다.
n1-standard-2
와 같이 최소 2개의 CPU와 4GB의 메모리가 있는 머신 유형을 선택해야 AI Platform 파이프라인을 배포할 수 있습니다. 요금은 머신 유형마다 다르게 청구됩니다. 머신 유형 가격 정보는 머신 유형 가격표를 참조하세요.탐색창의 노드 풀에서 보안을 클릭합니다. 노드 보안 양식이 표시됩니다.
서비스 계정 드롭다운 목록에서 이 가이드 앞부분에서 만든 서비스 계정을 선택합니다.
그렇지 않으면 GKE 클러스터를 원하는 대로 구성합니다. GKE 클러스터 만들기에 대해 자세히 알아보세요.
만들기를 클릭합니다.
GKE 클러스터에 Kubeflow Pipelines 설치
다음 안내에 따라 GKE 클러스터에 Kubeflow Pipelines를 설정합니다.
Google Cloud 콘솔에서 AI Platform 파이프라인을 엽니다.
AI Platform Pipelines 툴바에서 새 인스턴스를 클릭합니다. Google Cloud Marketplace에서 Kubeflow Pipelines가 열립니다.
구성을 클릭합니다. Kubeflow Pipelines 배포 양식이 열립니다.
클러스터 드롭다운 목록에서 이전 단계에서 만든 클러스터를 선택합니다. 사용하려는 클러스터가 배포에 적합하지 않은 경우 클러스터가 Kubeflow Pipelines 배포 요구사항을 충족하는지 확인합니다.
네임스페이스는 대규모 GKE 클러스터에서 리소스 관리를 위해 사용됩니다. 클러스터에서 네임스페이스를 사용하지 않으려면 네임스페이스 드롭다운 목록에서 기본을 선택합니다.
GKE 클러스터에서 네임스페이스를 사용하려는 경우 네임스페이스 드롭다운 목록을 사용하여 네임스페이스를 만듭니다. 네임스페이스를 만들려면 다음 안내를 따르세요.
- 네임스페이스 드롭다운 목록에서 네임스페이스 만들기를 선택합니다. 새 네임스페이스 이름 상자가 나타납니다.
- 새 네임스페이스 이름에 네임스페이스 이름을 입력합니다.
네임스페이스에 대해 자세히 알아 보려면 네임스페이스로 Kubernetes 구성에 대한 블로그 게시물을 읽어보세요.
앱 인스턴스 이름 입력란에 Kubeflow Pipelines 인스턴스의 이름을 입력합니다.
관리형 스토리지를 사용하면 ML 파이프라인의 메타데이터와 아티팩트를 Compute Engine 영구 디스크에 저장하는 대신 Cloud SQL과 Cloud Storage를 사용하여 저장할 수 있습니다. 관리형 서비스를 사용하여 파이프라인 아티팩트와 메타데이터를 저장하면 간편하게 클러스터의 데이터를 백업 및 복원할 수 있습니다. 관리형 스토리지를 사용하여 Kubeflow Pipelines를 배포하려면 관리형 스토리지 사용을 선택하고 다음 정보를 제공합니다.
아티팩트 스토리지 Cloud Storage 버킷: 관리형 스토리지를 사용하면 Kubeflow Pipelines에서 파이프라인 아티팩트를 Cloud Storage 버킷에 저장합니다. Kubeflow Pipelines에서 아티팩트를 저장할 버킷의 이름을 지정합니다. 지정된 버킷이 없으면 Kubeflow Pipelines 배포자가 자동으로
us-central1
리전에 버킷을 만듭니다.Cloud SQL 인스턴스 연결 이름: 관리형 스토리지를 사용하면 Kubeflow Pipelines에서 파이프라인 메타데이터를 Cloud SQL의 MySQL 데이터베이스에 저장합니다. Cloud SQL MySQL 인스턴스의 연결 이름을 지정합니다.
데이터베이스 사용자 이름: MySQL 인스턴스에 연결하는 경우 사용할 Kubeflow Pipelines의 데이터베이스 사용자 이름을 지정합니다. 현재 데이터베이스 사용자에게 관리형 스토리지로 Kubeflow Pipelines를 배포할 수 있는
ALL
MySQL 권한이 있어야 합니다. 이 필드를 비워두면 기본값이 root로 설정됩니다.데이터베이스 비밀번호: MySQL 인스턴스에 연결하는 경우 사용할 Kubeflow Pipelines의 데이터베이스 비밀번호를 지정합니다. 이 필드를 비워두면 Kubeflow Pipelines가 비밀번호를 제공하지 않고 데이터베이스에 연결하므로 지정한 사용자 이름에 비밀번호가 필요할 때 실패합니다.
데이터베이스 이름 프리픽스: 데이터베이스 이름 프리픽스를 지정합니다. 프리픽스 값은 문자로 시작해야 하며 소문자, 숫자, 밑줄만 사용할 수 있습니다.
배포 프로세스 중에 Kubeflow Pipelines는 'DATABASE_NAME_PREFIX_pipeline' 및 'DATABASE_NAME_PREFIX_metadata' 등 데이터베이스 두 개를 만듭니다. 이러한 이름의 데이터베이스가 MySQL 인스턴스에 있으면 Kubeflow Pipelines는 기존 데이터베이스를 다시 사용합니다. 이 값을 지정하지 않으면 앱 인스턴스 이름이 데이터베이스 이름 프리픽스로 사용됩니다.
배포를 클릭합니다. 이 단계를 완료하는 데 몇 분 정도 걸릴 수 있습니다.
파이프라인 대시보드에 액세스하려면 Google Cloud 콘솔에서 AI Platform 파이프라인을 엽니다.
그런 다음 AI Platform 파이프라인 인스턴스의 파이프라인 대시보드 열기를 클릭합니다.
기존 GKE 클러스터에 AI Platform 파이프라인 배포
GKE 클러스터에서 Google Cloud Marketplace를 사용하여 Kubeflow Pipelines를 배포하려면 다음 조건을 충족해야 합니다.
- 클러스터에 노드가 3개 이상 있어야 합니다. 각 노드에는 최소 2개의 CPU와 4GB의 메모리가 있어야 합니다.
- 클러스터의 액세스 범위는 모든 Cloud APIs에 대한 전체 액세스 권한이 부여되거나 클러스터가 커스텀 서비스 계정을 사용해야 합니다.
- 클러스터에 아직 Kubeflow Pipelines가 설치되지 않은 상태여야 합니다.
AI Platform 파이프라인을 위한 GKE 클러스터 구성에 대해 자세히 알아보세요.
다음 안내에 따라 GKE 클러스터에 Kubeflow Pipelines를 설정합니다.
Google Cloud 콘솔에서 AI Platform 파이프라인을 엽니다.
AI Platform Pipelines 툴바에서 새 인스턴스를 클릭합니다. Google Cloud Marketplace에서 Kubeflow Pipelines가 열립니다.
구성을 클릭합니다. Kubeflow Pipelines 배포 양식이 열립니다.
클러스터 드롭다운 목록에서 클러스터를 선택합니다. 사용하려는 클러스터가 배포에 적합하지 않은 경우 클러스터가 Kubeflow Pipelines 배포 요구사항을 충족하는지 확인합니다.
네임스페이스는 대규모 GKE 클러스터에서 리소스 관리를 위해 사용됩니다. 클러스터가 네임스페이스를 사용하지 않는 경우 네임스페이스 드롭다운 목록에서 기본을 선택합니다.
클러스터에서 네임스페이스를 사용하는 경우 기존 네임스페이스를 선택하거나 네임스페이스 드롭다운 목록을 사용하여 네임스페이스를 만듭니다. 네임스페이스를 만들려면 다음 안내를 따르세요.
- 네임스페이스 드롭다운 목록에서 네임스페이스 만들기를 선택합니다. 새 네임스페이스 이름 상자가 나타납니다.
- 새 네임스페이스 이름에 네임스페이스 이름을 입력합니다.
네임스페이스에 대해 자세히 알아 보려면 네임스페이스로 Kubernetes 구성에 대한 블로그 게시물을 읽어보세요.
앱 인스턴스 이름 입력란에 Kubeflow Pipelines 인스턴스의 이름을 입력합니다.
관리형 스토리지를 사용하면 ML 파이프라인의 메타데이터와 아티팩트를 Compute Engine 영구 디스크에 저장하는 대신 Cloud SQL과 Cloud Storage를 사용하여 저장할 수 있습니다. 관리형 서비스를 사용하여 파이프라인 아티팩트와 메타데이터를 저장하면 간편하게 클러스터의 데이터를 백업 및 복원할 수 있습니다. 관리형 스토리지를 사용하여 Kubeflow Pipelines를 배포하려면 관리형 스토리지 사용을 선택하고 다음 정보를 제공합니다.
아티팩트 스토리지 Cloud Storage 버킷: 관리형 스토리지를 사용하면 Kubeflow Pipelines에서 파이프라인 아티팩트를 Cloud Storage 버킷에 저장합니다. Kubeflow Pipelines에서 아티팩트를 저장할 버킷의 이름을 지정합니다. 지정된 버킷이 없으면 Kubeflow Pipelines 배포자가 자동으로
us-central1
리전에 버킷을 만듭니다.Cloud SQL 인스턴스 연결 이름: 관리형 스토리지를 사용하면 Kubeflow Pipelines에서 파이프라인 메타데이터를 Cloud SQL의 MySQL 데이터베이스에 저장합니다. Cloud SQL MySQL 인스턴스의 연결 이름을 지정합니다.
데이터베이스 사용자 이름: MySQL 인스턴스에 연결하는 경우 사용할 Kubeflow Pipelines의 데이터베이스 사용자 이름을 지정합니다. 현재 데이터베이스 사용자에게 관리형 스토리지로 Kubeflow Pipelines를 배포할 수 있는
ALL
MySQL 권한이 있어야 합니다. 이 필드를 비워두면 기본값이 root로 설정됩니다.데이터베이스 비밀번호: MySQL 인스턴스에 연결하는 경우 사용할 Kubeflow Pipelines의 데이터베이스 비밀번호를 지정합니다. 이 필드를 비워두면 Kubeflow Pipelines가 비밀번호를 제공하지 않고 데이터베이스에 연결하므로 지정한 사용자 이름에 비밀번호가 필요할 때 실패합니다.
데이터베이스 이름 프리픽스: 데이터베이스 이름 프리픽스를 지정합니다. 프리픽스 값은 문자로 시작해야 하며 소문자, 숫자, 밑줄만 사용할 수 있습니다.
배포 프로세스 중에 Kubeflow Pipelines는 'DATABASE_NAME_PREFIX_pipeline' 및 'DATABASE_NAME_PREFIX_metadata' 등 데이터베이스 두 개를 만듭니다. 이러한 이름의 데이터베이스가 MySQL 인스턴스에 있으면 Kubeflow Pipelines는 기존 데이터베이스를 다시 사용합니다. 이 값을 지정하지 않으면 앱 인스턴스 이름이 데이터베이스 이름 프리픽스로 사용됩니다.
배포를 클릭합니다. 이 단계를 완료하는 데 몇 분 정도 걸릴 수 있습니다.
파이프라인 대시보드에 액세스하려면 Google Cloud 콘솔에서 AI Platform 파이프라인을 엽니다.
그런 다음 AI Platform 파이프라인 인스턴스의 파이프라인 대시보드 열기를 클릭합니다.
다음 단계
- ML 프로세스를 파이프라인으로 조정
- Kubeflow Pipelines 사용자 인터페이스를 사용하여 파이프라인을 실행합니다.
- AI Platform Pipelines 및 ML 파이프라인 자세히 알아보기