Vertex AI는 ML 모델과 AI 애플리케이션을 학습시키고 배포할 수 있는 머신러닝(ML) 플랫폼입니다. 기존 Cloud Run 서비스에 생성형 AI 기능을 추가하려면 Vertex AI를 사용하여 Gemini, PaLM, Imagen, Codey 등과 같은 생성형 AI 모델에 액세스하면 됩니다.
이 가이드에서는 Cloud Run 통합을 사용하여 Cloud Run 서비스에 대한 Vertex AI 액세스를 빠르게 설정하는 방법을 설명합니다.
시작하기 전에
- 통합하려는 Cloud Run 서비스가 이미 배포되었는지 확인합니다.
- Vertex AI 가격 책정 페이지를 검토합니다. 통합에 사용되는 개별 리소스에 대해 요금이 청구됩니다.
필요한 역할
Cloud Run 통합을 사용하려면 사용자 또는 관리자가 두 가지 서로 다른 주 구성원에 IAM 역할을 부여해야 합니다.
Google 계정에 필요한 역할을 보려면 클릭하세요.
Cloud Run 통합을 사용하는 데 필요한 권한을 얻으려면 관리자에게 Google 계정에 프로젝트에 대한 다음 IAM 역할을 부여해 달라고 요청하세요.
- Cloud Run 개발자(
roles/run.developer
) - Compute 뷰어(
roles/compute.viewer
) - 서버리스 통합 개발자(
roles/runapps.developer
) - 서버리스 통합 작업자(
roles/runapps.operator
) - 서비스 계정 사용자(
roles/iam.serviceAccountUser
)
서비스 계정의 필수 역할을 보려면 클릭합니다.
Cloud Run 서비스를 배포하려면 자동 생성된 Compute Engine 기본 서비스 계정을 사용하거나 사용자 관리형 서비스 계정을 지정하면 됩니다. 서비스 계정에는 다음 역할이 있어야 합니다.
- Cloud Run 개발자(
roles/run.developer
) - 로그 버킷 작성자(
roles/logging.bucketWriter
) - 서비스 계정 사용자(
roles/iam.serviceAccountUser
) - 스토리지 관리자(
roles/storage.admin
) - 프로젝트 IAM 관리자(
roles/project.iamAdmin
)
Vertex AI에 서비스 연결
Cloud Run 통합을 사용하여 Vertex AI에 연결하면 통합은 다음과 같은 작업을 수행합니다.
- Cloud Run 서비스가 Vertex AI 생성형 AI 모델에 액세스하도록 Vertex AI API를 사용 설정합니다.
- 서비스 ID에 필요한 역할을 부여합니다.
콘솔 또는 명령줄을 사용하여 통합을 만들 수 있습니다.
Console
Google Cloud 콘솔에서 Cloud Run 페이지로 이동합니다.
서비스 목록에서 이 통합에서 사용할 서비스를 클릭합니다.
Integrations 탭을 클릭합니다.
통합 추가를 클릭합니다.
Vertex AI를 클릭합니다.
기본 이름을 사용하거나 사용하려는 값으로 이름을 변경합니다.
API 목록을 사용 설정하라는 메시지가 표시되면 사용 설정을 클릭하고 API가 사용 설정될 때까지 기다립니다.
제출을 클릭하고 통합이 완료될 때까지 기다립니다. 최대 1분이 걸릴 수 있습니다.
gcloud
최신 Google Cloud CLI로 업데이트합니다.
gcloud components update
통합을 만듭니다.
gcloud beta run integrations create \ --type=vertex-genai \ --service=SERVICE \
다음과 같이 바꿉니다.
- SERVICE를 Cloud Run 서비스 이름으로 바꿉니다.
필요한 경우
--service-account=SERVICE_ACCOUNT_EMAIL
플래그를 포함합니다.SERVICE_ACCOUNT_EMAIL을 서비스를 배포하는 데 사용되는 사용자 관리 서비스 계정 이메일 주소(
PROJECT_NUMBER-compute@developer.gserviceaccount.com
)로 바꿉니다. 기본 컴퓨팅 서비스 계정(SERVICE_ACCOUNT_ID@PROJECT_ID.iam.gserviceaccount.com
)을 사용하려면 이 플래그를 생략합니다.Cloud Run 통합을 배포할 때 지정된 서비스 계정을 계속 사용하려면 다음을 실행합니다.
gcloud config set runapps/deployment-service-account
Cloud Run 서비스에 Vertex AI API를 호출할 수 있는 권한이 부여될 때까지 최대 1분 정도 기다립니다.
[vertex-genai] integration [vertex-genai-xxx] has been created successfully.
gcloud beta run integrations describe
를 사용하여 상태를 확인할 수 있습니다.
Vertex AI 통합 보기
Cloud Run 서비스에 대한 Vertex AI 통합의 현재 상태를 보려면 다음 안내를 따르세요.
Console
Google Cloud 콘솔에서 Cloud Run 페이지로 이동합니다.
서비스 목록에서 이 통합에서 사용할 서비스를 클릭합니다.
Integrations 탭을 클릭합니다.
관심 있는 Vertex AI 통합을 찾고 세부정보 보기를 클릭합니다.
gcloud
다음 명령어를 사용하여 사용 가능한 통합 목록을 가져옵니다.
gcloud beta run integrations list
반환된 목록의 이름을 사용하여 세부정보를 표시합니다.
gcloud beta run integrations describe INTEGRATION_NAME
INTEGRATION_NAME을 Vertex AI 통합의 이름으로 바꿉니다.
Vertex AI 통합 삭제
통합을 삭제하면 해당 통합에 연결된 모든 Google Cloud 리소스도 삭제되지만 Cloud Run 서비스는 삭제되지 않습니다.
Cloud Run 서비스에서 Vertex AI 통합을 삭제하려면 다음 안내를 따르세요.
Console
Google Cloud 콘솔에서 Cloud Run 페이지로 이동합니다.
통합을 삭제하려는 서비스를 클릭합니다.
Integrations 탭을 클릭합니다.
관심 있는 Vertex AI 통합을 찾고 통합 오른쪽에 있는 줄임표 아이콘을 클릭한 다음 삭제를 클릭합니다.
gcloud
다음 명령어를 사용하여 사용 가능한 통합 목록을 가져옵니다.
gcloud beta run integrations list
반환된 목록의 이름을 사용하여 통합을 삭제합니다.
gcloud beta run integrations delete INTEGRATION_NAME
다음과 같이 바꿉니다.
- INTEGRATION_NAME을 Vertex AI 통합의 이름으로 바꿉니다.
원하는 경우 다음 플래그 옵션을 사용할 수 있습니다.
옵션 설명 --service-account
삭제 작업을 수행할 사용자 관리형 서비스 계정 이메일 주소입니다.
코드에서 Vertex AI 생성형 AI 모델 액세스
통합을 완료한 후 Vertex AI 모델 API로 요청을 보내고 Vertex AI 스튜디오를 사용하여 애플리케이션에서 생성형 AI 모델을 빠르게 테스트하고 맞춤설정할 수 있습니다.
제한사항
Cloud Run 통합은 특정 리전에서만 지원됩니다. Cloud Run 통합에서 지원되지 않는 리전을 사용해야 하는 경우 Vertex AI 위치를 참조하세요.