Menjalankan pemeriksaan preflight

Dokumen ini memberikan informasi tentang pemeriksaan preflight.

Meninjau aturan firewall Anda

Pada versi 1.29 dan yang lebih baru, pemeriksaan preflight sisi server diaktifkan secara default saat Anda membuat, mengupdate, dan mengupgrade cluster. Pemeriksaan preflight sisi server memerlukan aturan firewall tambahan. Di Aturan firewall untuk cluster admin, telusuri "Pemeriksaan preflight" dan pastikan semua aturan firewall yang diperlukan sudah dikonfigurasi.

Menjalankan gkectl check-config

Jika berencana membuat cluster menggunakan gkectl, jalankan gkectl create-config untuk membuat file konfigurasi Google Distributed Cloud. File konfigurasi akan mendorong penginstalan Anda: Anda memberikan informasi tentang lingkungan vSphere, jaringan dan load balancer, serta tampilan cluster yang Anda inginkan. Anda dapat membuat file konfigurasi sebelum atau setelah membuat workstation admin. Agar lulus pemeriksaan tertentu, pemeriksaan harus dijalankan dari workstation admin.

Setelah memodifikasi file agar memenuhi kebutuhan lingkungan dan cluster Anda, gunakan file tersebut untuk membuat cluster di lingkungan lokal Anda.

Sebelum membuat cluster menggunakan gkectl, jalankan gkectl check-config untuk memvalidasi file konfigurasi dengan beberapa pemeriksaan preflight. Jika perintah ini menampilkan pesan FAILURE, perbaiki masalah dan validasi file lagi. Jika validasi fitur tertentu menampilkan pesan PERINGATAN, Anda harus memperbaiki masalah yang mendasarinya sebelum dapat menggunakan fitur tersebut.

Mode pemeriksaan preflight dan melewati validasi

gkectl check-config memiliki mode default dan mode cepat:

  • Dalam mode default, perintah memvalidasi setiap kolom secara komprehensif. Selain itu, mode default membuat virtual machine (VM) vSphere sementara sebagai bagian dari validasinya, yang dapat memerlukan waktu lebih lama.

  • Dalam mode cepat, perintah ini melewati pemeriksaan yang membuat VM pengujian dan hanya menjalankan pemeriksaan cepat. Anda mengaktifkan mode cepat dengan meneruskan flag --fast.

Anda dapat melewati validasi tertentu dengan meneruskan flag lain, yang dijelaskan dalam gkectl check-config --help.

Traffic antara workstation admin dan VM pengujian

Dalam mode default, pemeriksaan preflight akan membuat VM pengujian untuk cluster. Setiap VM pengujian menjalankan server HTTP yang memantau port 443 dan di port node yang telah Anda tentukan dalam file konfigurasi.

Beberapa alamat IP ditetapkan ke VM pengujian. Jika file konfigurasi Anda menunjukkan bahwa node cluster Anda akan mendapatkan alamat IP dari server DHCP, pemeriksaan preflight akan menggunakan server DHCP untuk menetapkan alamat IP ke VM pengujian. Jika file konfigurasi Anda menunjukkan bahwa node cluster Anda akan diberi alamat IP statis, pemeriksaan preflight akan menetapkan alamat IP statis yang Anda tentukan di file blok IP ke VM pengujian.

Pemeriksaan preflight, yang berjalan di workstation admin, mengirimkan permintaan HTTP ke VM pengujian menggunakan berbagai alamat IP yang ditetapkan ke VM. Permintaan dikirim ke port 443 dan ke port node yang Anda tentukan di file konfigurasi.

Kapan saya harus menjalankan pemeriksaan preflight?

Praktik terbaiknya adalah menjalankan pemeriksaan preflight lebih awal dan sebelum mencoba membuat cluster. Menjalankan pemeriksaan preflight lebih awal dapat membantu memastikan bahwa Anda telah mengonfigurasi lingkungan vSphere dan jaringan Anda dengan benar.

Jika Anda menggunakan Google Distributed Cloud versi 1.2.0-gke.6, jalankan gkectl check-config dua kali:

  1. Jalankan gkectl check-config --fast.

  2. Jalankan gkectl prepare.

  3. Jalankan gkectl check-config lagi, tanpa flag --fast.

Alasan menjalankan dua kali adalah karena gkectl prepare mengupload template VM untuk image OS node cluster ke lingkungan vSphere Anda. Template VM tersebut harus sudah tersedia sebelum Anda menjalankan rangkaian validasi lengkap.

Di Google Distributed Cloud versi 1.2.1 dan yang lebih baru, perintah check-config sendiri mengupload template VM, sehingga Anda dapat menjalankan kumpulan validasi lengkap sebelum menjalankan gkectl prepare:

  1. Jalankan gkectl check-config, tanpa flag --fast.

  2. Jalankan gkectl prepare.

Pemeriksaan preflight memvalidasi nilai yang Anda berikan ke file. Anda tidak perlu mengisi setiap kolom dalam file konfigurasi untuk menjalankan pemeriksaan preflight pada file tersebut. Namun, Anda dapat memvalidasi file secara iteratif saat mengisi kolomnya. Misalnya, jika hanya ingin memvalidasi konfigurasi vCenter, Anda hanya dapat mengisi kolom vcenter dan menjalankan pemeriksaan terhadap kolom tersebut.

Perlu diingat bahwa konfigurasi Google Distributed Cloud Anda tidak dapat diubah setelah cluster dibuat. Menjalankan pemeriksaan preflight membantu Anda menemukan dan menyelesaikan masalah dalam konfigurasi sebelum membuat cluster.

Mempertahankan VM pengujian untuk proses debug

Dimulai dengan Google Distributed Cloud versi 1.2.1, perintah gkectl check-config memiliki flag --cleanup.

Saat melakukan serangkaian validasi lengkap, gkectl check-config akan membuat VM pengujian dan kunci SSH terkait. Jika Anda ingin mempertahankan VM pengujian dan kunci SSH untuk tujuan proses debug, tetapkan --cleanup ke salah (false).

Nilai default --cleanup adalah true.

Daftar pemeriksaan preflight

Pemeriksaan preflight memvalidasi setiap kolom dalam file konfigurasi. Berikut adalah pemeriksaan saat ini:

Kategori Deskripsi
File konfigurasi

Umumnya memvalidasi bahwa setiap kolom dan spesifikasi memiliki format dan nilai yang diharapkan.

Dilewati dengan flag --skip-validation-config.

Lewati validasi kolom proxy dengan flag --skip-validation-proxy.

Internet

Memvalidasi akses internet ke domain yang diperlukan. Memvalidasi konfigurasi proxy berdasarkan tempat Anda menjalankan gkectl.

Dilewati dengan flag --skip-validation-internet.

OS image

Memvalidasi bahwa OS image ada.

Dilewati dengan flag --skip-validation-os-images.

Versi OS Windows

Memvalidasi versi OS Windows.

Memvalidasi bahwa versi Windows didukung saat membuat workstation admin dengan alat command line gkeadm. Perlu diketahui bahwa meskipun alat gkeadm tersedia untuk Windows 10, Windows Server 2019, dan Linux, tidak ada pemeriksaan preflight untuk Linux. Validasi ini dimulai dari rilis versi 1.4.1.

Versi cluster

Memvalidasi bahwa versi cluster admin, versi cluster pengguna, dan versi gkectl cocok untuk pembuatan dan upgrade.

Dilewati dengan flag --skip-validation-cluster-version.

Kondisi cluster

Memvalidasi bahwa admin atau cluster pengguna sehat sebelum upgrade:

  • Cluster admin: Pemeriksaan mencakup layanan Kubernetes, status komponen, DaemonSets, deployment, mesin, dan pod.
  • Cluster pengguna: Pemeriksaan mencakup layanan Kubernetes, endpoint API cluster, StatefulSets, deployment, deployment mesin, mesin, dan pod.

Dilewati dengan flag --skip-validation-cluster-health.

Masuk Memeriksa apakah cluster pengguna memiliki objek Gateway Istio sebelum melakukan upgrade.
IP yang dicadangkan

Memvalidasi bahwa tersedia cukup alamat IP untuk dibuat dan diupgrade.

Dilewati dengan flag --skip-validation-reserved-ips.

Google Cloud
ID Project
[*].projectid
Memvalidasi project ID yang diberikan ke berbagai kolom dalam konfigurasi. Jika project ID tidak ada, validasi akan dilewati.
Daftarkan akun layanan
registerserviceaccountkeypath
Memvalidasi bahwa akun layanan memiliki peran IAM yang diperlukan. Memvalidasi bahwa API yang diperlukan sudah diaktifkan.
Hubungkan akun layanan
agentserviceaccountkeypath
Memvalidasi bahwa akun layanan memiliki peran IAM yang diperlukan. Memvalidasi bahwa API yang diperlukan sudah diaktifkan.
Akun layanan Kemampuan Observasi Google Cloud
stackdriver.serviceaccountkeypath
Memvalidasi bahwa akun layanan memiliki peran IAM yang diperlukan. Memvalidasi bahwa API yang diperlukan sudah diaktifkan.
Dilewati dengan flag --skip-validation-gcp.
Akses ke akses gcr.io/gke-on-prem-release Memvalidasi akses ke registry image container Google Distributed Cloud yang dihosting di Container Registry.

Dilewati oleh flag --skip-validation-docker.

Registry Docker
privateregistryconfig
Jika dikonfigurasi, memvalidasi akses ke registry Docker.

Dilewati dengan flag --skip-validation-docker.

vCenter Memastikan semua kolom vcenter ada, dan juga memeriksa hal berikut:
Kredensial
vcenter.credentials.[*]
Memvalidasi autentikasi ke Server vCenter menggunakan kredensial pengguna yang diberikan.
Versi vSphere Memvalidasi bahwa versi vCenter dan ESXi didukung.
Pusat Data
vcenter.datacenter
Memvalidasi bahwa pusat data vSphere ada.
Datastore
vcenter.datastore
Memvalidasi bahwa datastore vSphere ada.
Disk data
vcenter.datadisk
Memvalidasi bahwa disk virtual machine (VMDK) vSphere belum ada di vSphere.
Kumpulan resource
vcenter.resourcepool
Memvalidasi bahwa kumpulan resource vSphere ada.
Network
vcenter.network
Memvalidasi bahwa jaringan vSphere ada.

Dilewati dengan flag --skip-validation-infra.

Penyimpanan
Driver CSI vSphere Memvalidasi bahwa driver vSphere CSI diaktifkan jika ada intree atau CSI vSphere PersistentVolumes. Artinya, dalam file konfigurasi cluster pengguna, storage.vSphereCSIDisabled tidak ditetapkan ke true.
Parameter StorageClass

Memvalidasi bahwa StorageClass tidak memiliki salah satu parameter yang tidak didukung berikut:

  • hostfailurestolerates
  • penyediaan paksa
  • penyimpanan cache
  • disk setrip
  • penyimpanan objekspace
  • iopslimit
  • format disk

Jika cluster Anda memiliki StorageClasses dengan salah satu parameter sebelumnya, yang mungkin berarti Anda perlu memigrasikan volume.

Untuk mengetahui informasi selengkapnya, lihat Pertimbangan untuk Migrasi Volume vSphere In-Tree dan bagian masalah umum tentang upgrade pada versi 1.15.

Anotasi dalam PersistentVolume dan PersistentVolumeKlaim yang dibuat secara statis

Sebelum upgrade, periksa anotasi di vSphere in-tree PersistentVolumes dan vSphere PersistentVolumecus:

  • PersistentVolume dalam hierarki vSphere yang dibuat secara statis memiliki anotasi pv.kubernetes.io/provisioned-by: kubernetes.io/vsphere-volume
  • vSphere PersistentVolumesKlaims yang dibuat secara statis memiliki anotasi volume.beta.kubernetes.io/storage-provisioner: kubernetes.io/vsphere-volume dan volume.kubernetes.io/storage-provisioner: kubernetes.io/vsphere-volume

Jika cluster Anda memiliki PersistentVolume dalam hierarki atau vSphere PersistentVolume Claimss tanpa anotasi ini, Anda harus menganotasi PersistentVolumes dan PersistentVolumecus sebelum melanjutkan, lihat Pertimbangan untuk Migrasi Volume vSphere In-Tree.

Workload CSI

Memvalidasi bahwa cluster berhasil menjalankan workload yang menggunakan PersistentVolume yang disediakan secara dinamis yang dibuat melalui Driver vSphere CSI.

Pemeriksaan ini berjalan selama upgrade dan hanya jika ada volume vSphere dalam hierarki dan tidak ada Volume CSI vSphere.

Pemeriksaan ini:

  1. Memeriksa bahwa tidak ada resource yang tersisa dari validasi sebelumnya.
  2. Menemukan atau membuat StorageClass dengan kolom penyedia yang ditetapkan ke kolom penyediaan yang ditetapkan ke "csi.vsphere.vmware.com".
    1. Di cluster pengguna, kebijakan ini memilih standard-rwo StorageClass CSI.
    2. Dalam cluster admin, menemukan StorageClass dengan kolom penyedia yang ditetapkan ke csi.vsphere.vmware.com. Jika StorageClass seperti itu tidak ada di cluster, pengujian akan membuat CSI StorageClass baru untuk sementara dan menggunakannya dalam pemeriksaan.
  3. Membuat PersistentVolumeKlaim di namespace default menggunakan StorageClass yang ditemukan atau dibuat di langkah sebelumnya dan menunggu PersistentVolume yang dibuat secara dinamis berada dalam fase Bound.
  4. Membuat Tugas penulis di namespace default yang memasang PersistentVolume yang dibuat di atas. Pod penulis dijadwalkan dan ketika dimulai, Pod akan menulis string ke file dalam sistem file yang terpasang.
  5. Menggambarkan mata penulis Job dan Pod terkaitnya.
  6. Membuat Tugas pembaca di namespace default yang memasang PersistentVolume yang dibuat di atas. Pod pembaca akan dijadwalkan dan pada saat dimulai, Pod akan membaca file yang ditulis oleh Pod penulis dan memastikan bahwa data yang ditulis oleh Pod penulis berhasil dibaca.
  7. Menggambarkan Job pembaca dan Pod terkaitnya.
  8. Menurunkan PersistentVolume Claims, sehingga PersistentVolume juga dihapus.
  9. Menurunkan StorageClass jika dibuat selama pengujian.

Host kelompok anti-afinitas

Memvalidasi bahwa jumlah host vCenter fisik setidaknya tiga jika antiAffinityGroups diaktifkan.

Untuk menonaktifkan antiAffinityGroups bagi cluster, lihat antiAffinityGroups.enabled dan catatan rilis ini.

Dilewati dengan flag --skip-validation-infra.

Load balancer

Memvalidasi konfigurasi load balancing:

  • Jika mode load balancing terintegrasi (lbmode: Integrated), memvalidasi bahwa semua kolom bigip ada dalam spesifikasi admincluster dan usercluster.
  • Jika mode load balancing manual (lbmode: Manual), memvalidasi bahwa semua kolom manuallbspec ada dalam spesifikasi admincluster dan usercluster.
Load balancing terintegrasi
bigip.credentials.[*] Memvalidasi kredensial F5 BIG-IP Anda.
bigip.partition Memvalidasi bahwa partisi yang disediakan ada.
Peran pengguna BIG-IP F5 Memvalidasi bahwa pengguna F5 BIG-IP yang disediakan memiliki peran Administrator atau Resource Administrator.
bigip.vips.[*] Memvalidasi VIP yang disediakan.

Dilewati dengan flag --fast atau --skip-validation-load-balancer.

Load balancing manual
Konfigurasi jaringan Memvalidasi VIP, IP node, dll.

Dilewati dengan flag --fast atau --skip-validation-load-balancer.

[*].manuallbspec.[*] Memvalidasi port node yang disediakan.
Dilewati dengan flag --skip-validation-load-balancer.
Networking

Memvalidasi bahwa rentang CIDR, VIP, dan IP statis yang diberikan (jika dikonfigurasi) tersedia. Memeriksa apakah alamat IP tidak tumpang-tindih.

Dilewati dengan flag --skip-validation-net-config.

DNS

Memvalidasi bahwa server DNS yang disediakan tersedia.

Dilewati dengan flag --skip-validation-dns.

NTP

Memvalidasi bahwa server Protokol Waktu Jaringan (NTP) yang disediakan tersedia.

Dilewati dengan flag --skip-validation-tod.

VIP

Ping VIP yang disediakan. Pemeriksaan ini berhasil jika ping gagal, yang menunjukkan bahwa VIP yang diharapkan belum digunakan.

Dilewati dengan flag --skip-validation-vips.

IP Node

Melakukan ping ke alamat IP node yang disediakan. Pemeriksaan ini berhasil jika ping gagal, yang menunjukkan bahwa IP node yang diharapkan belum digunakan.

Dilewati dengan flag --skip-validation-node-ips.

Hasil pemeriksaan preflight

Pemeriksaan preflight dapat menampilkan hasil berikut:

BERHASIL
Kolom dan nilainya lulus pemeriksaan.
GAGAL
Kolom dan/atau nilainya tidak lulus pemeriksaan. Jika pemeriksaan menampilkan pesan FAILURE, perbaiki masalahnya dan validasi ulang file.
DILEWATI

Pemeriksaan dilewati, mungkin karena pemeriksaan tersebut tidak relevan dengan konfigurasi Anda. Misalnya, jika Anda menggunakan server DHCP, pemeriksaan DNS dan pemeriksaan IP node—yang hanya relevan untuk konfigurasi IP statis—akan dilewati.

Jika Anda meneruskan flag yang melewati validasi, pemeriksaan yang dilewati tidak akan menampilkan hasil LEWATI; sebaliknya, validasi tidak akan dijalankan dan tidak muncul dalam output perintah.

TIDAK DIKETAHUI

Lewati menampilkan kode bukan nol. Anda dapat menganggap hasil UNKNOWN sebagai pemeriksaan yang gagal. TIDAK DIKETAHUI biasanya menunjukkan bahwa pemeriksaan gagal menjalankan beberapa paket sistem, seperti gagal menjalankan nslookup atau gagal menjalankan gcloud.

Segera hadir

Pemeriksaan preflight berikut akan ditambahkan dalam rilis mendatang:

  • Server NTP

Menjalankan pemeriksaan preflight

Anda dapat menjalankan pemeriksaan preflight dengan menjalankan perintah berikut:

gkectl check-config --config [CONFIG]

dengan [CONFIG] adalah jalur ke file konfigurasi Google Distributed Cloud Anda

Berjalan dalam mode cepat

Jika ingin, Anda dapat menjalankan pemeriksaan preflight dalam "mode cepat", yang akan melewati validasi yang membuat VM pengujian sementara, seperti validasi VIP load balancing dan IP node. Untuk melakukannya, teruskan --fast:

gkectl check-config --config [CONFIG] --fast

Melewati validasi tertentu

Anda dapat meneruskan flag untuk melewati validasi tertentu secara terperinci, seperti DNS, proxy, dan jaringan. Setiap tanda lewati diawali dengan --skip-[VALIDATION].

Untuk mempelajari flag lewati yang tersedia, jalankan perintah berikut. Secara opsional, lihat referensi check-config gkectl:

gkectl check-config --help

Misalnya, untuk melewati validasi load balancer:

gkectl check-config --config my-config.yaml --skip-validation-load-balancer 

Membatalkan pemeriksaan preflight

Jika Anda mulai menjalankan pemeriksaan preflight dan ingin membatalkannya, tekan CTRL + C dua kali. Jika pemeriksaan preflight membuat VM pengujian, pembatalan juga harus membersihkan VM secara otomatis.

Membersihkan VM uji

Jika ada VM pengujian yang tersisa setelah pemeriksaan preflight selesai, Anda dapat menghapus VM tersebut dari vCenter. VM pengujian memiliki nama seperti ini:

check-config-[dhcp|static]-[random number]

Untuk menghapus VM:

  1. Klik kanan VM, lalu klik Daya > Matikan

  2. Setelah VM dimatikan, klik kanan lagi VM, lalu klik Delete from Disk.

Contoh

Berikut adalah contoh output perintah. Dalam contoh ini, konfigurasi yang divalidasi menggunakan mode load balancing terintegrasi dan IP statis tanpa registry Docker eksternal:

- Validation Category: Config Check
    - [SUCCESS] Config

- Validation Category: Internet Access
    - [SUCCESS] Internet access to required domains

- Validation Category: GCP
    - [SUCCESS] GCP Service
    - [SUCCESS] GCP Service Account

- Validation Category: Docker Registry
    - [SUCCESS] gcr.io/gke-on-prem-release access

- Validation Category: vCenter
    - [SUCCESS] Credentials
    - [SUCCESS] Version
    - [SUCCESS] Datacenter
    - [SUCCESS] Datastore
    - [SUCCESS] Data Disk
    - [SUCCESS] Resource Pool
    - [SUCCESS] Network
    - [SUCCESS] VSphere CSI Driver

- Validation Category: F5 BIG-IP
    - [SUCCESS] Admin Cluster F5 (credentials, partition and user role)
    - [SUCCESS] User Cluster F5 (credentials, partition and user role)

- Validation Category: Network Configuration
    - [SUCCESS] CIDR, VIP and static IP (availability and overlapping)

- Validation Category: DNS
    - [SUCCESS] DNS (availability)

- Validation Category: VIPs
    - [SUCCESS] ping (availability)

- Validation Category: Node IPs
    - [SUCCESS] ping (availability)

Now running slow validation checks. ...

Reusing VM template "gke-on-prem-osimage-xxx" that already exists in vSphere.
Creating test VMs with admin cluster configuration...  DONE
Waiting to get IP addresses from test VMs...  DONE
Waiting for test VMs to become ready...  DONE

Reusing VM template "gke-on-prem-osimage-xxx" that already exists in vSphere.
Creating test VMs with user cluster configuration...  DONE
Waiting to get IP addresses from test VMs...  DONE
Waiting for test VMs to become ready...  DONE

- Validation Category: F5 BIG-IP
    - [SUCCESS] Admin Cluster VIP and NodeIP
    - [SUCCESS] Admin Cluster F5 Access
    - [SUCCESS] User Cluster VIP and NodeIP
    - [SUCCESS] User Cluster F5 Access

- Validation Category: Internet Access
    - [SUCCESS] Internet access to required domains

- Validation Category: vCenter on test VMs
    - [SUCCESS] Test VM: VCenter Access and Permission

- Validation Category: DNS on test VMs
    - [SUCCESS] Test VM: DNS Availability

- Validation Category: TOD on test VMs
    - [SUCCESS] Test VM: TOD Availability

- Validation Category: Docker Registry
    - [SUCCESS] gcr.io/gke-on-prem-release access

Deleting test VMs with admin cluster configuration...  DONE
Deleting test VMs with user cluster configuration...  DONE

Masalah umum

  • Untuk versi 1.3.0-gke.16:

    Anda harus menjalankan pemeriksaan validasi cepat, gkectl check-config --fast, untuk pemeriksaan preflight jika kedua hal berikut berlaku:

    1. Anda telah mengonfigurasi Google Distributed Cloud untuk menggunakan proxy.

    2. Anda menginstal salah satu paket berikut:

      • Paket /var/lib/gke/bundles/gke-onprem-vsphere-1.3.0-gke.16.tgz dari halaman Download.
      • Paket /var/lib/gke/bundles/gke-onprem-vsphere-1.3.0-gke.16.tgz dari workstation admin.

    Anda dapat menjalankan rangkaian validasi lengkap hanya jika telah menginstal paket lengkap. Contoh: /var/lib/gke/bundles/gke-onprem-vsphere-1.3.0-gke.16-full.tgz

  • Untuk versi 1.2.0-gke.6:

    Jika Anda menggunakan kumpulan resource bertingkat atau kumpulan resource default, gkectl check-config akan gagal saat Anda mencoba melakukan validasi rangkaian lengkap. Namun, Anda dapat melakukan kumpulan validasi yang lebih kecil dengan meneruskan tanda --fast.

    gkectl check-config --config [CONFIG] --fast

Langkah selanjutnya