Crea una organización de Gemini

En esta página, se explica cómo crear una organización nueva en Google Distributed Cloud (GDC) air-gapped y configurarla para usar Gemini.

En esta página, se usan dos términos que hacen referencia a conceptos diferentes: organización del cliente y organización de Gemini. Cada término se define de la siguiente manera:

  • Organización del cliente: Es la organización de GDC en la que los usuarios ejecutan sus cargas de trabajo, acceden a la infraestructura de la plataforma y usan los servicios de Vertex AI. Para obtener más información sobre las organizaciones de clientes, consulta Crea una organización de clientes.
  • Organización de Gemini: Es el recurso de organización configurado para ejecutar un servidor de modelos de Gemini. Por motivos de seguridad, no se permite que las cargas de trabajo de los usuarios se ejecuten en esta organización. Solo se debe ejecutar código de terceros aprobado por Google dentro de la organización de Gemini. La organización de Gemini es independiente de la organización del cliente y sigue un modelo de multiusuario único, en el que cada organización del cliente tiene su propia organización de Gemini correspondiente.

Para obtener más información sobre las diferencias entre organizaciones, consulta la Descripción general del operador.

Antes de comenzar

Para crear una organización de Gemini, debes cumplir con los siguientes requisitos:

  • Una organización del cliente en funcionamiento
  • Un navegador en tu sistema
  • La interfaz de línea de comandos (CLI) de Git
  • La CLI de kubectl
  • Es la CLI de gcloud.
  • Las herramientas de la CLI de jq y yq Para obtener detalles sobre la configuración del contenedor de herramientas, que contiene jq y yq, consulta el manual de ejecución OOPS-P0065.
  • Los roles necesarios de operador de infraestructura (IO) Para obtener más información sobre estos roles, consulta Prepara los permisos de IAM.

Además, asegúrate de cumplir con las comprobaciones previas a la implementación.

Crea la organización de Gemini

Sigue estos pasos para crear una organización de Gemini:

  1. Sigue la guía para crear una organización hasta que termines de conectar el proveedor de identidad de IO a la organización con IAC. Esta acción crea una organización independiente que funciona como la organización de Gemini en una sola zona. Sigue estos lineamientos cuando crees la organización:

    • Uno de los servidores disponibles debe ser un servidor Dell XE9680 con una clase de máquina d3-highgpu1-256-gdc-metal. El primer paso de las instrucciones para crear una organización con IaC proporciona un comando para verificar los servidores disponibles. Si el servidor con la clase de máquina d3-highgpu1-256-gdc-metal no está disponible, consulta la descripción general de la expansión dinámica para explorar las opciones de expansión del servidor. Luego, agrega el nuevo servidor de cargas de trabajo.

    • Cuando crees una organización con IaC, después de crear el recurso personalizado Organization, agrega la anotación organizations.resourcemanager.private.gdc.goog/shared-service-cluster-skip-create-cluster: "true" en el recurso personalizado para omitir la creación de un clúster de servicio compartido y optimizar los recursos.

    • Crea el recurso personalizado OrganizationZonalConfig en una sola zona. Esta zona se usa como la zona de Gemini. La organización del cliente debe estar en la misma zona, pero también se puede implementar en más zonas. Para obtener más información, consulta Modelo de implementación multizona para Gemini.

  2. Agrega la etiqueta lcm.private.gdc.goog/org-tenant="gemini" al recurso personalizado Organization de la organización de Gemini:

    KUBECONFIG=ROOT_ADMIN_KUBECONFIG_PATH
    GEMINI_ORG_NAME=GEMINI_ORGANIZATION_NAME
    
    kubectl label organization -n gpc-system ${GEMINI_ORG_NAME:?} \
      lcm.private.gdc.goog/org-tenant="gemini" --kubeconfig ${KUBECONFIG:?}
    

    Reemplaza lo siguiente:

    • ROOT_ADMIN_KUBECONFIG_PATH: Es la ruta al archivo kubeconfig del clúster de administrador raíz.
    • GEMINI_ORGANIZATION_NAME: Es el nombre de la organización de Gemini.
  3. Comprueba si el clúster de infraestructura de la organización de Gemini está en funcionamiento:

    kubectl get cluster/${GEMINI_ORG_NAME:?}-admin -n ${GEMINI_ORG_NAME:?}
    

    En el siguiente resultado, se muestra un ejemplo para una organización de Gemini llamada org-1:

    NAMESPACE   NAME          ABM VERSION        DESIRED ABM VERSION   CLUSTER STATE
    org-1       org-1-admin   1.30.500-gke.128   1.30.500-gke.128      Running
    
  4. Busca todos los nodos trabajadores que tengan una GPU H200 configurada dentro del clúster de infraestructura de la organización de Gemini:

    KUBECONFIG=GEM_ORG_CP_KUBECONFIG_PATH
    
    kubectl --kubeconfig ${KUBECONFIG:?} get nodes \
      -o json | jq -r \
      '.items[] | select(.status.capacity."nvidia.com/gpu-pod-NVIDIA_H200"=="8") | .metadata.name'
    

    Reemplaza GEM_ORG_CP_KUBECONFIG_PATH por la ruta de acceso al archivo kubeconfig del clúster de infraestructura de la organización para la organización de Gemini.

  5. Aplica la etiqueta gemini.gdc.goog/large-gemini=true a todos los nodos trabajadores con GPU H200 que obtuviste del comando anterior:

    NODE_NAME=H200_WORKER_NODE_NAME
    
    kubectl label node ${NODE_NAME:?} \
      "gemini.gdc.goog/large-gemini=true" \
      --kubeconfig ${KUBECONFIG:?}
    

    Reemplaza H200_WORKER_NODE_NAME por el nombre del nodo trabajador con una GPU H200.

Anula las puertas de funciones para los componentes operables de Gemini

Cuando termines de aprovisionar la organización de Gemini y confirmes que tiene el estado READY, debes anular los indicadores de funciones para habilitar los componentes operativos en la organización de Gemini o del cliente.

En la siguiente tabla, se resumen los runbooks que debes seguir para anular los parámetros de lanzamiento y habilitar los componentes operativos:

Componente operable Organización objetivo Referencia de runbook
GEMINI Organización de Gemini GEMINI-F0001
AICS Organización del cliente AICS-F0001
GPU Organización de Gemini GPU-F0001

Genera claves de encriptación

La generación de la clave de encriptación para una organización es una operación que se realiza una sola vez. Si vuelves a ejecutar el comando, el sistema ya no podrá descifrar ningún modelo subido. Para generar la clave, deberás ejecutar un trabajo en la nueva organización que acabas de crear.

KUBECONFIG=GEM_ORG_CP_KUBECONFIG_PATH
kubectl --kubeconfig=${KUBECONFIG:?} -n gemini create job --from=cronjob/gemini-weights-transfer-keygen

Una vez que se complete el trabajo, podrás leer la clave con el siguiente comando:

KUBECONFIG=GEM_ORG_CP_KUBECONFIG_PATH
kubectl --kubeconfig=${KUBECONFIG:?} -n gemini-system \
  logs job.batch/gemini-weights-transfer-keygen \
  | grep -oP '<PublicKey.*?</PublicKey>' | head -n 1

¿Qué sigue?