Configurar la red para Gemini

En esta página se explica cómo configurar Gemini en un entorno con air gap de Google Distributed Cloud (GDC). Esta guía está dirigida a los operadores de infraestructura (IOs) que gestionan las implementaciones de sistemas y contiene información sobre la infraestructura necesaria, la configuración del hardware para los pods de GPU y las configuraciones de red necesarias para implementar Gemini.

Antes de empezar

Para configurar la red de Gemini, debes haber instalado correctamente el clúster de administrador raíz en los racks base. Para obtener más información, consulta Bootstrap del clúster de administrador raíz.

Configurar el hardware de la GPU para Gemini

Para ejecutar Gemini en GDC, debes implementar el hardware necesario en forma de pod de GPU. Un pod de GPU consta de entre uno y ocho servidores de GPU que consumen mucha energía y es la unidad mínima que se puede implementar en los racks compatibles con GPU. Cada servidor de GPU se aloja en su propio rack y se conecta a un switch de gestión dedicado y a dos switches TOR compartidos. El número de servidores por rack depende del presupuesto de energía y de tus requisitos.

En el siguiente diagrama se muestran dos configuraciones de pods de GPU diferentes:

Configuración de rack de un pod de GPU

Imagen 1. Se muestran dos pods de GPU. El primer pod de GPU consta de ocho servidores de GPU. El segundo pod de GPU consta de cinco servidores de GPU.

En la figura 1, el primer pod de GPU consta de lo siguiente:

Un par de nubes privadas virtuales (VPC) dedicadas, que pueden admitir hasta ocho servidores de GPU. Para añadir más conexiones de servidor, es necesario crear nuevos pods de GPU.
Cada GPU XE9680 del pod de GPU tiene uso exclusivo de un conmutador TOR. Los TORs del pod de GPU no se comparten con otros recursos de computación o almacenamiento.
Se conectan dos conmutadores TOR para proporcionar conectividad de alto ancho de banda a los servidores de GPU.
Este pod de GPU consta de un máximo de ocho servidores de GPU. Cada servidor se aloja en su propio rack.
Cada servidor de GPU se conecta a un switch de gestión dedicado y a los switches TOR de GPU compartidos que forman un par de VPCs.

En la figura 1, el segundo pod de GPU mostrado comparte la misma arquitectura, pero consta de cinco servidores de GPU en lugar de ocho.