在 Gemini 组织中部署关键组件

本页面详细介绍了如何将 GenAI 路由器和模型服务器部署到您创建的 Gemini 组织。如需详细了解这些组件，请参阅主要组件。

准备工作

如需在 Gemini 组织中部署关键组件，您必须具备以下条件：

替换 Gemini 组织中的 GEMINI 和 GPU 可操作组件功能门。
验证 Gemini 组织是否已启动并正在运行。
将 Gemini 模型权重加载到 Gemini 组织中。

部署 GenAI 路由器和模型服务器

如需在 Gemini 组织中部署 GenAI 路由器和模型服务器，请按以下步骤操作：

将 GeminiPackage 自定义资源从 Gemini 组织应用到管理 API 服务器：

KUBECONFIG=GEM_ORG_MGMT_KUBECONFIG_PATH

kubectl apply --kubeconfig ${KUBECONFIG:?} -f << EOF
apiVersion: gemini.gdc.goog/v1
kind: GeminiPackage
metadata:
  name: gemini-l1opr-cr
  namespace: gemini-system
spec:
  applications:
  - name: l2crd
    path: gemini-l2crd
  - name: l2opr
    path: gemini-l2operator
  - name: genai-router
    path: gemini-genai-router
EOF

将 GEM_ORG_MGMT_KUBECONFIG_PATH 替换为 Gemini 组织的管理 API 服务器的 kubeconfig 文件路径。

按照 GEMINI-R0008 运行手册中的步骤部署 ServoConfig 自定义资源。或者，应用以下自定义资源：

kubectl apply --kubeconfig ${KUBECONFIG:?} -f - << EOF
apiVersion: aiplatform.gdc.goog/v1
kind: ServoConfig
metadata:
  name: gemini-models
  namespace: gemini-system
spec:
  modelCombos:
  - name: gemini-1.5-flash-002
    replicas: 2
  - name: gemini-1.5-pro-002
    replicas: 1
EOF

后续步骤

配置视频存储空间

在 Gemini 组织中部署关键组件 使用集合让一切井井有条 根据您的偏好保存内容并对其进行分类。

准备工作

部署 GenAI 路由器和模型服务器

后续步骤

在 Gemini 组织中部署关键组件