Crear una organización de Gemini

En esta página se explica cómo crear una organización en Google Distributed Cloud (GDC) air-gapped y cómo configurarla para usar Gemini.

En esta página se usan dos términos que hacen referencia a conceptos diferentes: organización de cliente y organización de Gemini. Cada término se define de la siguiente manera:

  • Organización del cliente: la organización de GDC en la que los usuarios ejecutan sus cargas de trabajo, acceden a la infraestructura de la plataforma y usan los servicios de Vertex AI. Para obtener más información sobre las organizaciones de clientes, consulta el artículo Crear una organización de clientes.
  • Organización de Gemini: recurso de organización configurado para ejecutar un servidor de modelos de Gemini. Por motivos de seguridad, no se permite que las cargas de trabajo de los usuarios se ejecuten en esta organización. Solo se debe ejecutar código de terceros aprobado por Google en la organización de Gemini. La organización de Gemini es independiente de la organización del cliente y sigue un modelo de multitenencia única, en el que cada organización de cliente tiene su propia organización de Gemini.

Para obtener más información sobre las diferencias entre organizaciones, consulta la descripción general de los operadores.

Antes de empezar

Para crear una organización de Gemini, debes tener lo siguiente:

  • Una organización de cliente operativa.
  • Un navegador en tu sistema.
  • La interfaz de línea de comandos (CLI) de Git.
  • La CLI de kubectl.
  • La CLI de gdcloud.
  • Las herramientas de la CLI jq y yq. Para obtener información sobre la configuración del contenedor de herramientas, que contiene jq y yq, consulta el runbook OOPS-P0065.
  • Los roles de operador de infraestructura (IO) necesarios. Para obtener más información sobre estos roles, consulta Preparar permisos de gestión de identidades y accesos.

Además, asegúrate de que cumples los requisitos previos a la implementación.

Crear la organización de Gemini

Sigue estos pasos para crear una organización de Gemini:

  1. Sigue la guía para crear una organización hasta que termines de conectar el proveedor de identidades de IO a la organización con IAC. Esta acción crea una organización independiente que actúa como organización de Gemini en una sola zona. Sigue estas directrices al crear la organización:

    • Uno de los servidores disponibles debe ser un servidor Dell XE9680 con una clase de máquina d3-highgpu1-256-gdc-metal. En el primer paso de las instrucciones para crear una organización con IaC, se proporciona un comando para comprobar los servidores disponibles. Si el servidor con la clase de máquina d3-highgpu1-256-gdc-metal no está disponible, consulta la sección Descripción general de la expansión dinámica para ver las opciones de expansión del servidor. A continuación, añade el nuevo servidor de carga de trabajo.

    • Cuando crees una organización con IaC, después de crear el recurso personalizado Organization, añade la anotación organizations.resourcemanager.private.gdc.goog/shared-service-cluster-skip-create-cluster: "true" en el recurso personalizado para omitir la creación de un clúster de servicios compartidos y optimizar los recursos.

    • Crea el recurso personalizado OrganizationZonalConfig en una sola zona. Esta zona se usa como zona de Gemini. La organización del cliente debe estar en la misma zona, pero también se puede desplegar en más zonas. Para obtener más información, consulta el modelo de implementación multizona de Gemini.

  2. Añade la etiqueta lcm.private.gdc.goog/org-tenant="gemini" al recurso personalizado Organization de la organización de Gemini:

    KUBECONFIG=ROOT_ADMIN_KUBECONFIG_PATH
    GEMINI_ORG_NAME=GEMINI_ORGANIZATION_NAME
    
    kubectl label organization -n gpc-system ${GEMINI_ORG_NAME:?} \
      lcm.private.gdc.goog/org-tenant="gemini" --kubeconfig ${KUBECONFIG:?}
    

    Haz los cambios siguientes:

    • ROOT_ADMIN_KUBECONFIG_PATH: la ruta al archivo kubeconfig del clúster de administrador raíz.
    • GEMINI_ORGANIZATION_NAME: el nombre de la organización de Gemini.
  3. Comprueba si el clúster de infraestructura de la organización de Gemini está en funcionamiento:

    kubectl get cluster/${GEMINI_ORG_NAME:?}-admin -n ${GEMINI_ORG_NAME:?}
    

    En el siguiente resultado se muestra un ejemplo de una organización de Gemini llamada org-1:

    NAMESPACE   NAME          ABM VERSION        DESIRED ABM VERSION   CLUSTER STATE
    org-1       org-1-admin   1.30.500-gke.128   1.30.500-gke.128      Running
    
  4. Busca todos los nodos de trabajador que tengan una GPU H200 configurada en el clúster de infraestructura de la organización de Gemini:

    KUBECONFIG=GEM_ORG_CP_KUBECONFIG_PATH
    
    kubectl --kubeconfig ${KUBECONFIG:?} get nodes \
      -o json | jq -r \
      '.items[] | select(.status.capacity."nvidia.com/gpu-pod-NVIDIA_H200"=="8") | .metadata.name'
    

    Sustituye GEM_ORG_CP_KUBECONFIG_PATH por la ruta al archivo kubeconfig del clúster de infraestructura de la organización de la organización de Gemini.

  5. Aplica la etiqueta gemini.gdc.goog/large-gemini=true a todos los nodos de trabajador con GPUs H200 que hayas obtenido con el comando anterior:

    NODE_NAME=H200_WORKER_NODE_NAME
    
    kubectl label node ${NODE_NAME:?} \
      "gemini.gdc.goog/large-gemini=true" \
      --kubeconfig ${KUBECONFIG:?}
    

    Sustituye H200_WORKER_NODE_NAME por el nombre del nodo de trabajo con una GPU H200.

Anular las puertas de funciones de los componentes operativos de Gemini

Cuando termines de aprovisionar la organización de Gemini y confirmes que tiene el estado READY, debes anular los feature gates para habilitar los componentes operativos en la organización de Gemini o del cliente.

En la siguiente tabla se resumen los runbooks que debes seguir para anular los feature gates y habilitar los componentes operativos:

Componente operable Organización de destino Referencia de los runbooks
GEMINI Organización de Gemini GEMINI-F0001
AICS Organización del cliente AICS-F0001
GPU Organización de Gemini GPU-F0001

Generar claves de cifrado

La generación de la clave de cifrado de una organización es una operación que se realiza una sola vez. Si vuelves a ejecutar el comando, el sistema ya no podrá descifrar ningún modelo subido. Para generar la clave, tendrás que ejecutar un trabajo en la nueva organización que acabas de crear.

KUBECONFIG=GEM_ORG_CP_KUBECONFIG_PATH
kubectl --kubeconfig=${KUBECONFIG:?} -n gemini create job --from=cronjob/gemini-weights-transfer-keygen

Una vez que se haya completado el trabajo, deberías poder leer la clave con el siguiente comando:

KUBECONFIG=GEM_ORG_CP_KUBECONFIG_PATH
kubectl --kubeconfig=${KUBECONFIG:?} -n gemini-system \
  logs job.batch/gemini-weights-transfer-keygen \
  | grep -oP '<PublicKey.*?</PublicKey>' | head -n 1

Siguientes pasos