Menyiapkan penayangan Knative

Pelajari cara menyiapkan dan mengonfigurasi penginstalan penayangan Knative Anda.

Sebelum memulai

Anda harus menginstal inferensi Knative di cluster GKE. Lihat panduan penginstalan untuk mengetahui detail tentang prasyarat cluster GKE dan cara menginstal inferensi Knative.

Menyiapkan autentikasi dengan Workload Identity

Anda dapat menggunakan Workload Identity untuk mengautentikasi layanan inferensi Knative Anda ke Google Cloud API dan layanan. Anda harus menyiapkan Workload Identity sebelum men-deploy layanan ke cluster Anda. Jika tidak, setiap layanan yang ada di cluster Anda sebelum mengaktifkan Workload Identity harus dimigrasikan. Pelajari lebih lanjut cara menggunakan Workload Identity.

Mengaktifkan metrik dengan Workload Identity

Untuk mengaktifkan metrik, seperti melaporkan jumlah permintaan atau latensi permintaan ke Google Cloud Observability, Anda perlu menetapkan izin tulis untuk Cloud Monitoring secara manual. Untuk mengetahui detailnya, lihat bagian Mengaktifkan metrik dengan Workload Identity.

Mengonfigurasi HTTPS dan domain kustom

Untuk mengaktifkan HTTPS dan menetapkan domain kustom, lihat halaman berikut:

Menyiapkan Cloud Service Mesh

Guna mengonfigurasi opsi Cloud Service Mesh untuk inferensi Knative, lihat Opsi bidang kontrol dalam cluster, termasuk cara menyiapkan jaringan internal pribadi.

Menyiapkan jaringan internal pribadi

Men-deploy layanan di jaringan internal berguna bagi perusahaan yang menyediakan aplikasi internal untuk staf mereka, dan untuk layanan yang digunakan oleh klien yang berjalan di luar cluster penayangan Knative. Dengan konfigurasi ini, resource lain di jaringan Anda dapat berkomunikasi dengan layanan menggunakan alamat IP internal (RFC 1918) pribadi yang tidak dapat diakses oleh publik.

Untuk membuat jaringan internal, konfigurasikan Cloud Service Mesh agar menggunakan Load Balancing TCP/UDP Internal, bukan load balancer jaringan eksternal publik. Selanjutnya, Anda dapat men-deploy layanan penayangan Knative pada alamat IP internal dalam jaringan VPC Anda.

Sebelum Anda memulai

Untuk menyiapkan load balancer internal:

  1. Mengaktifkan fitur load balancer internal di Cloud Service Mesh.

    Load balancer internal adalah fitur opsional yang dapat Anda konfigurasi selama penginstalan Cloud Service Mesh, atau dengan memperbarui penginstalan yang sudah ada.

    Ikuti langkah-langkah di Mengaktifkan fitur opsional pada bidang kontrol dalam cluster dan pastikan untuk menyertakan opsi skrip --option internal-load-balancer.

    Saat Anda menentukan opsi --option internal-load-balancer, skrip akan otomatis mengambil resource kustom Aktifkan load balancer internal dari GitHub. Jika Anda perlu mengubah resource kustom, ikuti petunjuk penggunaan opsi --custom_overlay.

  2. Jalankan perintah berikut untuk melihat update pada cluster GKE Anda:

    kubectl -n INGRESS_NAMESPACE get svc istio-ingressgateway --watch
    

    Ganti INGRESS_NAMESPACE dengan namespace layanan masuk Cloud Service Mesh Anda. Tentukan istio-system jika Anda menginstal Cloud Service Mesh menggunakan konfigurasi defaultnya.

    1. Perhatikan anotasi cloud.google.com/load-balancer-type: Internal.
    2. Cari nilai IP di load balancer Ingress untuk diubah menjadi alamat IP pribadi.
    3. Tekan Ctrl+C untuk menghentikan update setelah Anda melihat alamat IP pribadi di kolom IP.
  3. Untuk cluster pribadi di Google Cloud, Anda harus membuka port. Untuk mengetahui detailnya, lihat membuka port di cluster pribadi Anda dalam dokumentasi Cloud Service Mesh.

Untuk memverifikasi konektivitas internal setelah perubahan Anda:

  1. Deploy layanan yang disebut sample ke penayangan Knative di namespace default:

    gcloud run deploy sample \
    --image gcr.io/knative-samples/helloworld \
    --namespace default
    --platform gke
    
  2. Buat virtual machine (VM) Compute Engine di zona yang sama dengan cluster GKE:

    VM=cloudrun-gke-ilb-tutorial-vm
    
    gcloud compute instances create $VM
    
  3. Simpan alamat IP pribadi Gateway Istio Ingress dalam variabel lingkungan yang disebut EXTERNAL_IP dan file bernama external-ip.txt:

    export EXTERNAL_IP=$(kubectl -n INGRESS_NAMESPACE get svc istio-ingressgateway \
        -o jsonpath='{.status.loadBalancer.ingress[0].ip}' | tee external-ip.txt)
    

    Ganti INGRESS_NAMESPACE dengan namespace layanan masuk Cloud Service Mesh Anda. Tentukan istio-system jika Anda menginstal Cloud Service Mesh menggunakan konfigurasi defaultnya.

  4. Salin file yang berisi alamat IP ke VM:

    gcloud compute scp external-ip.txt $VM:~
    
  5. Hubungkan ke VM menggunakan SSH:

    gcloud compute ssh $VM
    
  6. Saat berada dalam sesi SSH, uji layanan contoh:

    curl -s -w'\n' -H Host:sample.default.nip.io $(cat external-ip.txt)
    

    Outputnya adalah sebagai berikut:

    Hello World!
    
  7. Keluar dari sesi SSH:

    exit
    

Menyiapkan lingkungan multi-tenant

Dalam kasus penggunaan multi-tenant, Anda harus mengelola dan men-deploy layanan penayangan Knative ke cluster Google Kubernetes Engine yang berada di luar project Anda saat ini. Untuk mengetahui informasi selengkapnya tentang multi-tenancy GKE, lihat Multi-tenancy cluster.

Untuk mempelajari cara mengonfigurasi multi-tenancy untuk penayangan Knative, lihat Multi-tenancy lintas project.

Langkah selanjutnya