En esta página, se explica cómo crear una organización nueva en Google Distributed Cloud (GDC) air-gapped y configurarla para usar Gemini.
En esta página, se usan dos términos que hacen referencia a conceptos diferentes: organización del cliente y organización de Gemini. Cada término se define de la siguiente manera:
- Organización del cliente: Es la organización de GDC en la que los usuarios ejecutan sus cargas de trabajo, acceden a la infraestructura de la plataforma y usan los servicios de Vertex AI. Para obtener más información sobre las organizaciones de clientes, consulta Crea una organización de clientes.
- Organización de Gemini: Es el recurso de organización configurado para ejecutar un servidor de modelos de Gemini. Por motivos de seguridad, no se permite que las cargas de trabajo de los usuarios se ejecuten en esta organización. Solo se debe ejecutar código de terceros aprobado por Google dentro de la organización de Gemini. La organización de Gemini es independiente de la organización del cliente y sigue un modelo de multiusuario único, en el que cada organización del cliente tiene su propia organización de Gemini correspondiente.
Para obtener más información sobre las diferencias entre organizaciones, consulta la Descripción general del operador.
Antes de comenzar
Para crear una organización de Gemini, debes cumplir con los siguientes requisitos:
- Una organización del cliente en funcionamiento
- Un navegador en tu sistema
- La interfaz de línea de comandos (CLI) de Git
- La CLI de kubectl
- Es la CLI de gcloud.
- Las herramientas de la CLI de
jqyyqPara obtener detalles sobre la configuración del contenedor de herramientas, que contienejqyyq, consulta el manual de ejecución OOPS-P0065. - Los roles necesarios de operador de infraestructura (IO) Para obtener más información sobre estos roles, consulta Prepara los permisos de IAM.
Además, asegúrate de cumplir con las comprobaciones previas a la implementación.
Crea la organización de Gemini
Sigue estos pasos para crear una organización de Gemini:
Sigue la guía para crear una organización hasta que termines de conectar el proveedor de identidad de IO a la organización con IAC. Esta acción crea una organización independiente que funciona como la organización de Gemini en una sola zona. Sigue estos lineamientos cuando crees la organización:
Uno de los servidores disponibles debe ser un servidor Dell XE9680 con una clase de máquina
d3-highgpu1-256-gdc-metal. El primer paso de las instrucciones para crear una organización con IaC proporciona un comando para verificar los servidores disponibles. Si el servidor con la clase de máquinad3-highgpu1-256-gdc-metalno está disponible, consulta la descripción general de la expansión dinámica para explorar las opciones de expansión del servidor. Luego, agrega el nuevo servidor de cargas de trabajo.Cuando crees una organización con IaC, después de crear el recurso personalizado
Organization, agrega la anotaciónorganizations.resourcemanager.private.gdc.goog/shared-service-cluster-skip-create-cluster: "true"en el recurso personalizado para omitir la creación de un clúster de servicio compartido y optimizar los recursos.Crea el recurso personalizado
OrganizationZonalConfigen una sola zona. Esta zona se usa como la zona de Gemini. La organización del cliente debe estar en la misma zona, pero también se puede implementar en más zonas. Para obtener más información, consulta Modelo de implementación multizona para Gemini.
Agrega la etiqueta
lcm.private.gdc.goog/org-tenant="gemini"al recurso personalizadoOrganizationde la organización de Gemini:KUBECONFIG=ROOT_ADMIN_KUBECONFIG_PATH GEMINI_ORG_NAME=GEMINI_ORGANIZATION_NAME kubectl label organization -n gpc-system ${GEMINI_ORG_NAME:?} \ lcm.private.gdc.goog/org-tenant="gemini" --kubeconfig ${KUBECONFIG:?}Reemplaza lo siguiente:
ROOT_ADMIN_KUBECONFIG_PATH: Es la ruta al archivo kubeconfig del clúster de administrador raíz.GEMINI_ORGANIZATION_NAME: Es el nombre de la organización de Gemini.
Comprueba si el clúster de infraestructura de la organización de Gemini está en funcionamiento:
kubectl get cluster/${GEMINI_ORG_NAME:?}-admin -n ${GEMINI_ORG_NAME:?}En el siguiente resultado, se muestra un ejemplo para una organización de Gemini llamada
org-1:NAMESPACE NAME ABM VERSION DESIRED ABM VERSION CLUSTER STATE org-1 org-1-admin 1.30.500-gke.128 1.30.500-gke.128 RunningBusca todos los nodos trabajadores que tengan una GPU H200 configurada dentro del clúster de infraestructura de la organización de Gemini:
KUBECONFIG=GEM_ORG_CP_KUBECONFIG_PATH kubectl --kubeconfig ${KUBECONFIG:?} get nodes \ -o json | jq -r \ '.items[] | select(.status.capacity."nvidia.com/gpu-pod-NVIDIA_H200"=="8") | .metadata.name'Reemplaza
GEM_ORG_CP_KUBECONFIG_PATHpor la ruta de acceso al archivo kubeconfig del clúster de infraestructura de la organización para la organización de Gemini.Aplica la etiqueta
gemini.gdc.goog/large-gemini=truea todos los nodos trabajadores con GPU H200 que obtuviste del comando anterior:NODE_NAME=H200_WORKER_NODE_NAME kubectl label node ${NODE_NAME:?} \ "gemini.gdc.goog/large-gemini=true" \ --kubeconfig ${KUBECONFIG:?}Reemplaza
H200_WORKER_NODE_NAMEpor el nombre del nodo trabajador con una GPU H200.
Anula las puertas de funciones para los componentes operables de Gemini
Cuando termines de aprovisionar la organización de Gemini y confirmes que tiene el estado READY, debes anular los indicadores de funciones para habilitar los componentes operativos en la organización de Gemini o del cliente.
En la siguiente tabla, se resumen los runbooks que debes seguir para anular los parámetros de lanzamiento y habilitar los componentes operativos:
| Componente operable | Organización objetivo | Referencia de runbook |
|---|---|---|
GEMINI |
Organización de Gemini | GEMINI-F0001 |
AICS |
Organización del cliente | AICS-F0001 |
GPU |
Organización de Gemini | GPU-F0001 |
Genera claves de encriptación
La generación de la clave de encriptación para una organización es una operación que se realiza una sola vez. Si vuelves a ejecutar el comando, el sistema ya no podrá descifrar ningún modelo subido. Para generar la clave, deberás ejecutar un trabajo en la nueva organización que acabas de crear.
KUBECONFIG=GEM_ORG_CP_KUBECONFIG_PATH
kubectl --kubeconfig=${KUBECONFIG:?} -n gemini create job --from=cronjob/gemini-weights-transfer-keygen
Una vez que se complete el trabajo, podrás leer la clave con el siguiente comando:
KUBECONFIG=GEM_ORG_CP_KUBECONFIG_PATH
kubectl --kubeconfig=${KUBECONFIG:?} -n gemini-system \
logs job.batch/gemini-weights-transfer-keygen \
| grep -oP '<PublicKey.*?</PublicKey>' | head -n 1