Gemini 조직에 주요 구성요소 배포

이 페이지에서는 생성한 Gemini 조직에 생성형 AI 라우터와 모델 서버를 배포하는 방법을 자세히 설명합니다. 이러한 구성요소에 대한 자세한 내용은 주요 구성요소를 참고하세요.

시작하기 전에

Gemini 조직에 주요 구성요소를 배포하려면 다음이 필요합니다.

Gemini 조직에서 GEMINI 및 GPU 작동 가능 구성요소 기능 게이트를 재정의합니다.
Gemini 조직이 작동되어 실행 중인지 확인합니다.
Gemini 조직에 Gemini 모델 가중치를 로드합니다.

생성형 AI 라우터 및 모델 서버 배포

Gemini 조직에 생성형 AI 라우터와 모델 서버를 배포하려면 다음 단계를 따르세요.

Gemini 조직에서 관리 API 서버에 GeminiPackage 커스텀 리소스를 적용합니다.

KUBECONFIG=GEM_ORG_MGMT_KUBECONFIG_PATH

kubectl apply --kubeconfig ${KUBECONFIG:?} -f << EOF
apiVersion: gemini.gdc.goog/v1
kind: GeminiPackage
metadata:
  name: gemini-l1opr-cr
  namespace: gemini-system
spec:
  applications:
  - name: l2crd
    path: gemini-l2crd
  - name: l2opr
    path: gemini-l2operator
  - name: genai-router
    path: gemini-genai-router
EOF

GEM_ORG_MGMT_KUBECONFIG_PATH를 Gemini 조직의 관리 API 서버 kubeconfig 파일 경로로 바꿉니다.

GEMINI-R0008 런북의 단계에 따라 ServoConfig 커스텀 리소스를 배포합니다. 또는 다음 맞춤 리소스를 적용합니다.

kubectl apply --kubeconfig ${KUBECONFIG:?} -f - << EOF
apiVersion: aiplatform.gdc.goog/v1
kind: ServoConfig
metadata:
  name: gemini-models
  namespace: gemini-system
spec:
  modelCombos:
  - name: gemini-1.5-flash-002
    replicas: 2
  - name: gemini-1.5-pro-002
    replicas: 1
EOF

다음 단계

동영상 저장소 구성하기

Gemini 조직에 주요 구성요소 배포 컬렉션을 사용해 정리하기 내 환경설정을 기준으로 콘텐츠를 저장하고 분류하세요.

시작하기 전에

생성형 AI 라우터 및 모델 서버 배포

다음 단계

Gemini 조직에 주요 구성요소 배포