Antes de pedir Gemini en la API conectada de Google Distributed Cloud, debes cumplir los requisitos de instalación que se describen en este documento. Para obtener más información, consulta Obtener asistencia.
Hardware certificado
Antes de pedir Gemini en la API conectada de GDC, debes adquirir hardware certificado que coincida con la configuración exacta descrita en esta sección. Esta configuración es para una sola máquina certificada por Google.
Elemento | SKU de Dell | Cantidad |
---|---|---|
PowerEdge XE9680, DSS RESTRICTED | 210-BHYV | 1 |
Chasis 2.5 | 379-BDTF | 1 |
Trusted Platform Module 2.0 V3 | 461-AAIG | 1 |
Chasis XE9680 6U con 8 GPUs y 8 NVMe de 2,5" | 321-BIEK | 1 |
Intel Xeon Platinum 8592+ 1.9G, 64C/128T, 20GT/s, 320M Cache, Turbo, HT (350W) DDR5-5600 | 338-CPBP | 1 |
Intel Xeon Platinum 8592+ 1.9G, 64C/128T, 20GT/s, 320M Cache, Turbo, HT (350W) DDR5-5600 | 338-CPBP | 1 |
Se ha seleccionado un procesador adicional | 379-BDCO | 1 |
Riser Config 2 | 330-BCHH | 1 |
Disipador de calor para configuración de 2 CPUs | 412-BBCN | 1 |
Rendimiento optimizado | 370-AAIP | 1 |
RDIMMs de 5600 MT/s | 370-BBRX | 1 |
C30, sin RAID para chasis NVME | 780-BCDO | 1 |
Sin mando | 405-AACD | 1 |
Configuración de la BIOS de rendimiento | 384-BBBL | 1 |
Modo de inicio de BIOS UEFI con partición GPT | 800-BBDM | 1 |
Ventilador de muy alto rendimiento x6 | 750-ADGJ | 1 |
3+3 FTR (GPU Power Brake Enabled), Hot-Plug PSU, 2800W MM HLAC (200-240Vac) Titanium, C22 Connector | 450-AMMN | 1 |
XE9680 System Motherboard, MX, MLK | 338-CPWL | 1 |
Pantalla LCD 2U de PowerEdge | 325-BETK | 1 |
Ensamblaje de GPUs NVIDIA HGX H200 8-GPU SXM 141 GB 700 W | 490-BKHF | 1 |
Tarjeta controladora BOSS-N1 con 2 unidades M.2 FIPS de 960 GB (RAID 1) | 403-BCVH | 1 |
Cable XE9680 BOSS | 470-AFNO | 1 |
No hay tarjeta NIC mezzanine OCP 3.0 | 412-AASK | 1 |
Sin sistema operativo, sin partición de utilidad | 611-BBBG | 1 |
iDRAC9, Datacenter 16G | 528-CTID | 1 |
Licencia de iDRAC Secure Enterprise Key Manager 2.0 | 634-BZIL | 1 |
Verificación de componentes seguros | 528-COYT | 1 |
iDRAC,contraseña generada de fábrica | 379-BCSF | 1 |
Módulo de servicio iDRAC (ISM), NO instalado | 379-BCQX | 1 |
Administrador de grupos de iDRAC, inhabilitado | 379-BCQY | 1 |
Brazo de gestión de cables para riel de rack XE9680 | 770-BEPB | 1 |
XE9680 Sliding Ready Rail (B28) | 770-BEPC | 1 |
PowerEdge XE9680, envío | 340-DDBX | 1 |
PowerEdge XE9680 con marcado CE, sin marcado CCC | 389-EFKE | 1 |
XE9680 Shipping Material | 343-BBXC | 1 |
Asistencia para la gestión de programas Enterprise | 973-3700 | 1 |
Básico al siguiente día hábil (36 meses) | 709-BFTF | 1 |
RESTRICTED:ProSupport One Data Center and Next Business Day Onsite Service Vol Low Ext, 24 Month(s) | 199-BTKS | 1 |
RESTRICTED:ProSupport One Data Center and Next Business Day Onsite Service Vol Low Init, 36 Month(s) | 199-BTKT | 1 |
Keep Your Hard Drive For Enterprise, 60 Month(s) | 711-BCXN | 1 |
ProDeploy Plus PowerEdge XE Series 5U6U | 683-BDSB | 1 |
Infraestructura de despliegue seleccionada | 701-6538 | 1 |
RDIMM de 128 GB, 5600 MT/s, Quad Rank | 370-BBQY | 16 |
Unidad AG de uso mixto NVMe de centro de datos de 800 GB U2 Gen4 con operador | 400-BRPJ | 1 |
C20 a C21, estilo PDU, 16 A, 2,4 m, cable de alimentación | 450-AGXK | 6 |
Broadcom 5720 Dual Port 1GbE LOM | 540-BDKD | 1 |
Adaptador de red Mellanox ConnectX-6 DX de doble puerto 100GbE QSFP56, altura completa | 540-BCXO | 2 |
Tamaño y peso
Cada máquina certificada por Google tiene una altura de 6 U y las siguientes dimensiones:
- Altura: 263,2 mm (10,36")
- Anchura: 482,0 mm (18,97")
- Profundidad: 1008,77 mm (39,71") con el marco frontal incluido
Cada máquina certificada por Google pesa 113,3 kg.
Energía y refrigeración
Cada máquina certificada por Google tiene las siguientes especificaciones eléctricas:
- Voltaje: de 100 a 240 V CA, 50/60 Hz
- Potencia: 11.000 W como máximo
Tu centro debe tener una refrigeración adecuada para admitir una (1) máquina certificada por Google por cada implementación de Gemini en la API conectada de GDC.
Redes
En esta sección se describen los requisitos de red para implementar Gemini en la API conectada de GDC. Además de la máquina certificada por Google con la API conectada de Gemini en GDC, debes proporcionar tu propia máquina local, como un portátil, para usarla solo durante la puesta en marcha. Es la máquina de puesta en marcha de la figura 1.
Conectividad de red
En la figura 1 se muestra Gemini en la red de APIs conectada a GDC.
Para implementar Gemini en la API conectada de GDC, debes cumplir los siguientes requisitos de conectividad de red:
Prepara un switch Top-of-Rack (ToR) que admita conectividad óptica de 100 gigabits con factor de forma pequeño enchufable cuádruple (QSFP).
Asigna un mínimo de un puerto óptico QFSP de 100 gigabits en el switch ToR por máquina certificada por Google. Sin embargo, Google recomienda asignar dos puertos ópticos QFSP de 100 G por máquina para garantizar la alta disponibilidad. Cada uno de estos puertos requiere cableado QSFP-100G-SR4-S.
Si asignas dos puertos por máquina, conecta ambos puertos del switch ToR al mismo adaptador de red Mellanox CX-6 en cada máquina.
Una conexión a Internet con un ancho de banda mínimo de 1 Gbps de descarga y 100 Mbps de subida.
Establece las siguientes conexiones de red para cada máquina certificada por Google:
Conecta uno o ambos puertos QFSP de 100 gigabits del adaptador de red Mellanox CX-6 de la máquina al switch ToR. Estos puertos gestionan el tráfico de alta velocidad de la API de Gemini en GDC connected y el software de Distributed Cloud connected.
Conecta el puerto del controlador de acceso remoto de Dell (iDRAC) integrado de la máquina a un conmutador de capa 2 independiente. Es necesario para la gestión de máquinas.
Solo para la puesta en marcha:
Asigna una dirección IP al puerto iDRAC que no forme parte del bloque CIDR de la zona conectada de Distributed Cloud de destino.
Establece la conectividad de red entre iDRAC y el equipo de puesta en marcha, tal como se muestra en la figura 1.
Configuración de red
Configura tu red local de la siguiente manera para implementar Gemini en la API conectada de GDC:
- Asigna una VLAN sin etiquetar dedicada configurada con un tamaño de unidad máxima de transmisión (MTU) de 1500 bytes.
- Asigna un bloque de direcciones CIDR IPv4 /26 privadas para la conectividad de las cargas de trabajo.
- Configura la conectividad de salida de la VLAN mediante el emparejamiento BGP y anuncia el bloque CIDR /26 asignado a la red upstream.
- Aprovisiona la VLAN con una ruta predeterminada a la red de nivel superior e Internet.
- Un servidor de protocolo de configuración dinámica de host (DHCP) que pueda asignar direcciones IPv4 a las máquinas certificadas por Google para el arranque. Las direcciones de este bloque DHCP deben ser la última sección /29 del bloque de direcciones CIDR IPv4 de conectividad de la carga de trabajo.
Configuración del interruptor ToR
Configura tu interruptor ToR de la siguiente manera:
- Habilita la compatibilidad con DHCPv4 y DNS en los puertos asignados a Gemini en las máquinas de API conectadas a GDC.
- Configura un bloque CIDR IPv4 privado /26 en la VLAN dedicada sin etiquetar con una MTU de 1500 bytes.
- Asigna la primera dirección IPv4 del bloque CIDR como puerta de enlace de la red.
- Asegúrate de que el resto de las direcciones IPv4 del bloque CIDR estén libres. Gemini en la API conectada de GDC las asigna automáticamente para funciones, servicios y endpoints de modelos locales del sistema.
Configuración del servidor DHCP
Configura el servidor DHCP para Gemini en las máquinas de la API conectadas a GDC de la siguiente manera:
- Se debe poder acceder al servidor DHCP desde todos los puertos del conmutador ToR conectados a Gemini en las máquinas de la API conectadas a GDC.
- Reserva el último segmento /29 del bloque CIDR IPv4 /26 que has asignado a Gemini en las máquinas de la API conectadas a GDC para las asignaciones de DHCP y configura el servidor DHCP para que use este segmento /29 como grupo de direcciones DHCP.
Configuración del cortafuegos
Configura tu cortafuegos local para permitir el tráfico de la API conectada de Gemini en GDC de la siguiente manera:
Nombre | Dirección IP de origen | Dirección IP de Anycast de destino | Protocolo | Puerto |
---|---|---|---|---|
Bootstrap | CIDR de zona de GDCc (/26) | 192.178.76.0/23 |
TCP | 80 |
Gestión conectada de GDC (TCP), servicio de certificación, servicio de comprobación de recitación y descargas de modelos | CIDR de zona de GDCc (/26) | 216.239.{32,34,36,38}.223 , 192.178.76.0/23 |
TCP | 443 |
Gestión de GDC conectado (gRPC, HTTPS) | CIDR de zona de GDCc (/26) | 192.178.76.0/23 |
TCP | 444 |
Gestión de GDC conectado (QUIC) | CIDR de zona de GDCc (/26) | 192.178.18.0/23 |
UDP | 443 |
Servicio de nombres de dominio (DNS) | CIDR de zona de GDCc (/26) | DNS de Google: 8.8.8.8 , 8.8.4.4 |
TCP, UDP | 53 |
Protocolo de hora de red (NTP) | CIDR de zona de GDCc (/26) | NTP de Google: 216.239.35.{0,4,8,12} |
UDP | 123 |
Confirmación remota de Intel TDX | CIDR de zona de GDCc (/26) | 4.255.75.174 |
TCP | 443 |
Clave de API de confirmación remota de Intel TDX
Para habilitar la certificación de las máquinas virtuales confidenciales que sirven a tus endpoints de API conectados de Gemini en GDC, debes obtener una clave de API de certificación remota de Intel TDX y proporcionársela a Google. Para obtener la clave de API, sigue los pasos que se indican en esta sección.
Ve a la página del servicio de certificación de aprovisionamiento de Intel® para la certificación ECDSA.
En la sección Get PCK Certificates (Obtener certificados PCK), haga clic en Subscribe (Suscribirse).
Sigue las instrucciones que aparecen en pantalla para crear una cuenta y establecer una suscripción al servicio de certificación de aprovisionamiento de Intel® SGX.
En la sección Tus suscripciones de tu cuenta, busca y anota la clave de API principal de tu suscripción al servicio de certificación de aprovisionamiento de Intel® SGX.
Información que debe proporcionar a Google
Proporciona la siguiente información a Google:
Información de contacto de la persona responsable de adquirir e implementar las máquinas certificadas por Google.
El bloque CIDR IPv4 /26 que has asignado a tus máquinas certificadas por Google.
Las claves de API principal y secundaria de tu suscripción al servicio de certificación de aprovisionamiento de Intel® SGX.
Las etiquetas de servicio de tus máquinas de API conectadas de Gemini on GDC. Para ver instrucciones, consulta el artículo Localizar el código de servicio exprés y la etiqueta de servicio.
Los identificadores de seguridad física (PSIDs) de las unidades de disco que no son de arranque en las máquinas certificadas por Google.
El ID del proyecto que aloja tu zona conectada de Distributed Cloud para Gemini en la API conectada de GDC. Google Cloud
Validar el hardware certificado
Antes de concertar una visita de un técnico de Google, debes validar tu hardware certificado de la siguiente manera:
Obtén la imagen de Docker de validación de hardware de tu representante de Google.
Instala o inicia Ubuntu Linux en la máquina certificada. Esta instalación solo se usa para tareas previas al vuelo. Google la sustituye por el software de la API conectada de Gemini en GDC una vez que se completa la fase previa al vuelo.
Instala los siguientes paquetes:
Carga la imagen de Docker del validador de hardware:
docker load -i gdc_hw_validator.tar
Especifica el bloque CIDR de la zona de Distributed Cloud conectada:
export IP_CIDR="ZONE_CIDR"
Sustituye
ZONE_CIDR
por el bloque CIDR de la zona.Ejecuta la secuencia de comandos de validación de hardware en el equipo certificado como
root
:docker run --rm -t --privileged -v "$(pwd)":/output -v /sys/fs/cgroup:/sys/fs/cgroup:rw \ --cgroupns=host --network=host -v /lib/modules:/lib/modules:ro -v /dev:/dev \ -e IP_CIDR="$IP_CIDR" gdc_hw_validator
Envía el archivo JSON generado por la secuencia de comandos a tu representante de Google.
Habilitar las APIs necesarias
Debes habilitar las siguientes APIs en tu proyecto de destino: Google Cloud
aiplatform.googleapis.com
anthos.googleapis.com
anthosaudit.googleapis.com
anthosgke.googleapis.com
cloudresourcemanager.googleapis.com
connectgateway.googleapis.com
compute.googleapis.com
container.googleapis.com
edgecontainer.googleapis.com
gdchardwaremanagement.googleapis.com
gkeconnect.googleapis.com
gkehub.googleapis.com
gkeonprem.googleapis.com
iam.googleapis.com
iamcredentials.googleapis.com
kubernetesmetadata.googleapis.com
logging.googleapis.com
monitoring.googleapis.com
multiclustermetering.googleapis.com
opsconfigmonitoring.googleapis.com
oslogin.googleapis.com
serviceusage.googleapis.com
stackdriver.googleapis.com
storage.googleapis.com
sts.googleapis.com
Para obtener información sobre cómo habilitar APIs, consulta el artículo Habilitar servicios.
Configurar una cuenta de facturación
Debes configurar una cuenta de facturación para el proyecto de destino, tal como se describe en el artículo Crear una cuenta de facturación de Cloud con servicio automático. Google Cloud
Siguientes pasos
Para poner en línea tu implementación de la API conectada de Gemini en GDC, haz lo siguiente:
Recibe e instala el hardware certificado de la API conectada de Gemini on GDC en la ubicación de destino.
Configura tu entorno de API conectada de Gemini en GDC como se ha descrito anteriormente en este documento.
Valida el hardware certificado tal como se ha descrito anteriormente en este documento.
Coordina con tu representante de Google la visita de un técnico de Google.
Completa la visita del técnico de Google para instalar y configurar el software de la API de Gemini en GDC conectado.
Completa los pasos que se indican en el artículo Crear y gestionar endpoints.