Menyiapkan jaringan untuk Gemini

Halaman ini memandu Anda cara menyiapkan Gemini dalam lingkungan air gap Google Distributed Cloud (GDC). Panduan ini ditujukan untuk Operator Infrastruktur (IO) yang mengelola deployment sistem, dan mencakup detail tentang infrastruktur yang diperlukan, penyiapan hardware untuk pod GPU, dan konfigurasi jaringan yang diperlukan untuk men-deploy Gemini.

Sebelum memulai

Untuk menyiapkan konfigurasi jaringan Gemini, Anda harus berhasil menginstal cluster admin root di rak dasar. Untuk mengetahui informasi selengkapnya, lihat Bootstrapping cluster admin root.

Mengonfigurasi hardware GPU Anda untuk Gemini

Untuk menjalankan Gemini dalam GDC, Anda harus men-deploy hardware yang diperlukan dalam bentuk pod GPU. Pod GPU terdiri dari satu hingga delapan server GPU yang mengonsumsi daya dan merupakan unit minimum yang dapat di-deploy dari rak yang kompatibel dengan GPU. Setiap server GPU ditempatkan di raknya sendiri dan terhubung ke switch pengelolaan khusus dan dua switch Top of Rack (TOR) bersama. Jumlah server per rak bergantung pada anggaran daya dan persyaratan Anda.

Dua konfigurasi pod GPU yang berbeda ditunjukkan dalam diagram berikut:

Konfigurasi rak pod GPU

Gambar 1. Dua pod GPU ditampilkan. Pod GPU pertama terdiri dari delapan server GPU. Pod GPU kedua terdiri dari lima server GPU.

Pada gambar 1, pod GPU pertama terdiri dari:

  • Pasangan Virtual Private Cloud (VPC) khusus, yang dapat mendukung hingga delapan server GPU. Koneksi server tambahan memerlukan pembuatan pod GPU baru.
  • Setiap GPU XE9680 di pod GPU memiliki penggunaan eksklusif switch TOR. TOR di pod GPU tidak dibagikan dengan resource komputasi atau penyimpanan lainnya.
  • Dua switch TOR terhubung untuk menyediakan konektivitas bandwidth tinggi bagi server GPU.
  • Pod GPU ini terdiri dari maksimal delapan server GPU. Setiap server ditempatkan di raknya sendiri.
  • Setiap server GPU terhubung ke switch pengelolaan khusus dan switch TOR GPU bersama yang membentuk pasangan VPC.

Pada gambar 1, pod GPU kedua yang ditampilkan memiliki arsitektur yang sama, tetapi pod GPU terdiri dari lima server GPU, bukan delapan.

Menyiapkan jaringan untuk Gemini

Untuk mengonfigurasi jaringan Anda untuk Gemini di GDC, ikuti langkah-langkah berikut:

  1. Lakukan perluasan dinamis pada pod GPU. Ikuti langkah-langkah yang tercantum di Melakukan ekspansi dinamis. Jika Anda mengalami masalah saat resource SubcomponentOverride tidak dapat diterapkan selama perluasan tingkat zona, ikuti buku pedoman OLT-R0003.

  2. Pastikan koneksi berhasil. Tetapkan variabel lingkungan KUBECONFIG untuk terhubung ke cluster admin root:

    KUBECONFIG=KUBECONFIG_PATH
    

    Ganti KUBECONFIG_PATH dengan jalur ke file kubeconfig cluster admin root.

  3. Dapatkan status tombol TOR dan Pengelolaan:

    kubectl --kubeconfig=$KUBECONFIG get torswitch -n gpc-system
    kubectl --kubeconfig=$KUBECONFIG get managementswitch -n gpc-system
    
  4. Periksa output dan pastikan kolom READY menampilkan nilai True untuk kedua switch:

    NAME AGE VENDOR SERIAL-NUMBER MANAGEMENT-IP READY OSVERSION CREDENTIAL-NAME LICENSE-NAME
    aa-aa-torsw01 10h Cisco 005056B4FC41 172.100.1.130 True 10.3(3) aa-aa-torsw01-admin
    aa-aa-torsw02 10h Cisco 005056B4966C 172.100.1.131 True 10.3(3) aa-aa-torsw02-admin
    
  5. Jika Anda mengalami masalah hardware yang memengaruhi konfigurasi jaringan, lihat Mengatasi kegagalan hardware.

Mengatasi kegagalan hardware

Jika Anda mengalami kegagalan hardware untuk switch di rak yang diperluas, lakukan proses Pengembalian dan Penggantian Produk Switch (RMA) untuk switch TOR dan Pengelolaan. Ikuti petunjuk di PNET-R2001.

Langkah berikutnya