Configurer le réseau pour Gemini

Cette page vous explique comment configurer Gemini dans un environnement Google Distributed Cloud (GDC) isolé. Ce guide s'adresse aux opérateurs d'infrastructure (IO) qui gèrent les déploiements de systèmes. Il fournit des informations détaillées sur l'infrastructure requise, la configuration matérielle des pods GPU et les configurations réseau nécessaires au déploiement de Gemini.

Avant de commencer

Pour configurer la configuration réseau de Gemini, vous devez avoir installé le cluster d'administrateur racine dans les racks de base. Pour en savoir plus, consultez Bootstrap du cluster d'administrateur racine.

Configurer votre matériel GPU pour Gemini

Pour exécuter Gemini dans GDC, vous devez déployer le matériel nécessaire sous la forme d'un pod de GPU. Un pod de GPU se compose d'un à huit serveurs GPU énergivores et constitue l'unité déployable minimale des racks compatibles avec les GPU. Chaque serveur GPU est installé dans son propre rack et se connecte à un commutateur de gestion dédié et à deux commutateurs TOR (Top of Rack) partagés. Le nombre de serveurs par rack dépend du budget d'alimentation et de vos besoins.

Le schéma suivant illustre deux configurations de pods de GPU différentes :

Configuration du rack d'un pod GPU

Figure 1 : Deux pods de GPU sont affichés. Le premier pod de GPU se compose de huit serveurs GPU. Le deuxième pod GPU se compose de cinq serveurs GPU.

Dans la figure 1, le premier pod GPU se compose des éléments suivants :

Une paire de clouds privés virtuels (VPC) dédiée, qui peut prendre en charge jusqu'à huit serveurs GPU. Pour ajouter des connexions de serveur, vous devez créer des pods GPU.
Chaque GPU XE9680 du pod de GPU utilise exclusivement un commutateur TOR. Les TOR du pod GPU ne sont pas partagés avec d'autres ressources de calcul ou de stockage.
Deux commutateurs TOR sont connectés pour fournir une connectivité à bande passante élevée aux serveurs GPU.
Ce pod de GPU se compose d'au maximum huit serveurs de GPU. Chaque serveur est installé dans son propre rack.
Chaque serveur GPU se connecte à la fois à un commutateur de gestion dédié et aux commutateurs TOR GPU partagés qui forment une paire VPC.

Dans la figure 1, le deuxième pod de GPU présenté partage la même architecture, mais il se compose de cinq serveurs GPU au lieu de huit.