En esta página se explica cómo crear una organización en Google Distributed Cloud (GDC) air-gapped y cómo configurarla para usar Gemini.
En esta página se usan dos términos que hacen referencia a conceptos diferentes: organización de cliente y organización de Gemini. Cada término se define de la siguiente manera:
- Organización del cliente: la organización de GDC en la que los usuarios ejecutan sus cargas de trabajo, acceden a la infraestructura de la plataforma y usan los servicios de Vertex AI. Para obtener más información sobre las organizaciones de clientes, consulta el artículo Crear una organización de clientes.
- Organización de Gemini: recurso de organización configurado para ejecutar un servidor de modelos de Gemini. Por motivos de seguridad, no se permite que las cargas de trabajo de los usuarios se ejecuten en esta organización. Solo se debe ejecutar código de terceros aprobado por Google en la organización de Gemini. La organización de Gemini es independiente de la organización del cliente y sigue un modelo de multitenencia única, en el que cada organización de cliente tiene su propia organización de Gemini.
Para obtener más información sobre las diferencias entre organizaciones, consulta la descripción general de los operadores.
Antes de empezar
Para crear una organización de Gemini, debes tener lo siguiente:
- Una organización de cliente operativa.
- Un navegador en tu sistema.
- La interfaz de línea de comandos (CLI) de Git.
- La CLI de kubectl.
- La CLI de gdcloud.
- Las herramientas de la CLI
jqyyq. Para obtener información sobre la configuración del contenedor de herramientas, que contienejqyyq, consulta el runbook OOPS-P0065. - Los roles de operador de infraestructura (IO) necesarios. Para obtener más información sobre estos roles, consulta Preparar permisos de gestión de identidades y accesos.
Además, asegúrate de que cumples los requisitos previos a la implementación.
Crear la organización de Gemini
Sigue estos pasos para crear una organización de Gemini:
Sigue la guía para crear una organización hasta que termines de conectar el proveedor de identidades de IO a la organización con IAC. Esta acción crea una organización independiente que actúa como organización de Gemini en una sola zona. Sigue estas directrices al crear la organización:
Uno de los servidores disponibles debe ser un servidor Dell XE9680 con una clase de máquina
d3-highgpu1-256-gdc-metal. En el primer paso de las instrucciones para crear una organización con IaC, se proporciona un comando para comprobar los servidores disponibles. Si el servidor con la clase de máquinad3-highgpu1-256-gdc-metalno está disponible, consulta la sección Descripción general de la expansión dinámica para ver las opciones de expansión del servidor. A continuación, añade el nuevo servidor de carga de trabajo.Cuando crees una organización con IaC, después de crear el recurso personalizado
Organization, añade la anotaciónorganizations.resourcemanager.private.gdc.goog/shared-service-cluster-skip-create-cluster: "true"en el recurso personalizado para omitir la creación de un clúster de servicios compartidos y optimizar los recursos.Crea el recurso personalizado
OrganizationZonalConfigen una sola zona. Esta zona se usa como zona de Gemini. La organización del cliente debe estar en la misma zona, pero también se puede desplegar en más zonas. Para obtener más información, consulta el modelo de implementación multizona de Gemini.
Añade la etiqueta
lcm.private.gdc.goog/org-tenant="gemini"al recurso personalizadoOrganizationde la organización de Gemini:KUBECONFIG=ROOT_ADMIN_KUBECONFIG_PATH GEMINI_ORG_NAME=GEMINI_ORGANIZATION_NAME kubectl label organization -n gpc-system ${GEMINI_ORG_NAME:?} \ lcm.private.gdc.goog/org-tenant="gemini" --kubeconfig ${KUBECONFIG:?}Haz los cambios siguientes:
ROOT_ADMIN_KUBECONFIG_PATH: la ruta al archivo kubeconfig del clúster de administrador raíz.GEMINI_ORGANIZATION_NAME: el nombre de la organización de Gemini.
Comprueba si el clúster de infraestructura de la organización de Gemini está en funcionamiento:
kubectl get cluster/${GEMINI_ORG_NAME:?}-admin -n ${GEMINI_ORG_NAME:?}En el siguiente resultado se muestra un ejemplo de una organización de Gemini llamada
org-1:NAMESPACE NAME ABM VERSION DESIRED ABM VERSION CLUSTER STATE org-1 org-1-admin 1.30.500-gke.128 1.30.500-gke.128 RunningBusca todos los nodos de trabajador que tengan una GPU H200 configurada en el clúster de infraestructura de la organización de Gemini:
KUBECONFIG=GEM_ORG_CP_KUBECONFIG_PATH kubectl --kubeconfig ${KUBECONFIG:?} get nodes \ -o json | jq -r \ '.items[] | select(.status.capacity."nvidia.com/gpu-pod-NVIDIA_H200"=="8") | .metadata.name'Sustituye
GEM_ORG_CP_KUBECONFIG_PATHpor la ruta al archivo kubeconfig del clúster de infraestructura de la organización de la organización de Gemini.Aplica la etiqueta
gemini.gdc.goog/large-gemini=truea todos los nodos de trabajador con GPUs H200 que hayas obtenido con el comando anterior:NODE_NAME=H200_WORKER_NODE_NAME kubectl label node ${NODE_NAME:?} \ "gemini.gdc.goog/large-gemini=true" \ --kubeconfig ${KUBECONFIG:?}Sustituye
H200_WORKER_NODE_NAMEpor el nombre del nodo de trabajo con una GPU H200.
Anular las puertas de funciones de los componentes operativos de Gemini
Cuando termines de aprovisionar la organización de Gemini y confirmes que tiene el estado READY, debes anular los feature gates para habilitar los componentes operativos en la organización de Gemini o del cliente.
En la siguiente tabla se resumen los runbooks que debes seguir para anular los feature gates y habilitar los componentes operativos:
| Componente operable | Organización de destino | Referencia de los runbooks |
|---|---|---|
GEMINI |
Organización de Gemini | GEMINI-F0001 |
AICS |
Organización del cliente | AICS-F0001 |
GPU |
Organización de Gemini | GPU-F0001 |
Generar claves de cifrado
La generación de la clave de cifrado de una organización es una operación que se realiza una sola vez. Si vuelves a ejecutar el comando, el sistema ya no podrá descifrar ningún modelo subido. Para generar la clave, tendrás que ejecutar un trabajo en la nueva organización que acabas de crear.
KUBECONFIG=GEM_ORG_CP_KUBECONFIG_PATH
kubectl --kubeconfig=${KUBECONFIG:?} -n gemini create job --from=cronjob/gemini-weights-transfer-keygen
Una vez que se haya completado el trabajo, deberías poder leer la clave con el siguiente comando:
KUBECONFIG=GEM_ORG_CP_KUBECONFIG_PATH
kubectl --kubeconfig=${KUBECONFIG:?} -n gemini-system \
logs job.batch/gemini-weights-transfer-keygen \
| grep -oP '<PublicKey.*?</PublicKey>' | head -n 1