Cloud Composer 1 | Cloud Composer 2 | Cloud Composer 3
Halaman ini menjelaskan cara memperbarui lingkungan.
Tentang operasi update
Saat Anda mengubah parameter lingkungan, seperti menentukan parameter skalabilitas dan performa baru, atau menginstal paket PyPI kustom, lingkungan Anda akan diperbarui.
Setelah operasi ini selesai, perubahan akan tersedia di lingkungan Anda.
Untuk satu lingkungan Cloud Composer, Anda hanya dapat memulai satu operasi update dalam satu waktu. Anda harus menunggu operasi update selesai sebelum memulai operasi lingkungan lain.
Pengaruh update terhadap tugas Airflow yang sedang berjalan
Saat Anda menjalankan operasi update, penjadwal dan pekerja Airflow di lingkungan Anda mungkin memerlukan mulai ulang. Dalam hal ini, semua tugas yang sedang berjalan akan dihentikan. Setelah operasi update selesai, Airflow menjadwalkan tugas ini untuk dicoba ulang, bergantung pada cara Anda mengonfigurasi percobaan ulang untuk DAG.
Perubahan berikut menyebabkan penghentian tugas Airflow:
- Mengupgrade lingkungan Anda ke versi baru.
- Menambahkan, mengubah, atau menghapus paket PyPI kustom.
- Mengubah variabel lingkungan Cloud Composer.
- Menambahkan atau menghapus opsi konfigurasi Airflow akan mengganti, atau mengubah nilainya.
- Mengubah CPU, memori, atau penyimpanan pekerja Airflow.
- Mengurangi jumlah maksimum pekerja Airflow, jika nilai baru lebih rendah dari jumlah pekerja yang sedang berjalan. Misalnya, jika lingkungan saat ini menjalankan tiga pekerja, dan maksimumnya dikurangi menjadi dua.
- Mengubah mode ketahanan lingkungan.
Perubahan berikut tidak menyebabkan penghentian tugas Airflow:
- Membuat, memperbarui, atau menghapus DAG (bukan operasi update).
- Menjeda atau membatalkan jeda DAG (bukan operasi pembaruan).
- Mengubah variabel Airflow (bukan operasi update).
- Mengubah koneksi Airflow (bukan operasi update).
- Mengaktifkan atau menonaktifkan integrasi Silsilah Data Dataplex.
- Mengubah ukuran lingkungan.
- Mengubah jumlah penjadwal.
- Mengubah CPU, memori, atau penyimpanan penjadwal Airflow.
- Mengubah jumlah pemicu.
- Mengubah CPU, memori, atau penyimpanan pemicu Airflow.
- Mengubah CPU, memori, atau penyimpanan server web Airflow.
- Meningkatkan atau menurunkan jumlah minimum pekerja.
- Mengurangi jumlah maksimum pekerja Airflow. Misalnya, jika lingkungan saat ini menjalankan dua pekerja, dan maksimumnya dikurangi menjadi tiga.
- Mengubah masa pemeliharaan.
- Mengubah setelan snapshot terjadwal.
- Mengubah label lingkungan.
Melakukan update dengan Terraform
Jalankan terraform plan
sebelum terraform apply
untuk melihat apakah Terraform membuat lingkungan baru, bukan mengupdatenya.
Sebelum memulai
Pastikan akun Anda, akun layanan lingkungan Anda, dan akun Agen Layanan Cloud Composer di project Anda memiliki izin yang diperlukan:
Akun Anda harus memiliki peran yang dapat memicu operasi pembaruan lingkungan.
Akun layanan lingkungan Anda harus memiliki peran yang memiliki izin yang cukup untuk melakukan operasi update.
Perintah
gcloud composer environments update
dihentikan saat operasi selesai. Anda dapat menggunakan flag--async
untuk menghindari menunggu operasi selesai.
Memperbarui lingkungan
Untuk informasi selengkapnya tentang mengupdate lingkungan, lihat halaman dokumentasi lainnya tentang operasi update tertentu. Contoh:
- Mengganti opsi konfigurasi Airflow
- Menetapkan variabel lingkungan
- Menginstal dependensi Python
- Menskalakan lingkungan
- Mengonfigurasi jaringan yang diizinkan
Melihat detail lingkungan
Konsol
Di konsol Google Cloud, buka halaman Environments.
Di daftar lingkungan, klik nama lingkungan Anda. Halaman Environment details akan terbuka.
gcloud
Jalankan perintah gcloud
berikut:
gcloud composer environments describe ENVIRONMENT_NAME \
--location LOCATION
Ganti:
ENVIRONMENT_NAME
dengan nama lingkungan.LOCATION
dengan region tempat lingkungan tersebut berada.
API
Buat permintaan API environments.get
.
Contoh:
GET https://composer.googleapis.com/v1/projects/example-project/
locations/us-central1/environments/example-environment
Terraform
Jalankan perintah terraform state show
untuk resource lingkungan Anda.
Nama resource Terraform lingkungan Anda mungkin berbeda dengan nama lingkungan Anda.
terraform state show google_composer_environment.RESOURCE_NAME
Ganti:
RESOURCE_NAME
dengan nama resource lingkungan Anda.
Me-roll back perubahan update
Dalam beberapa situasi yang jarang terjadi, operasi update mungkin terganggu (misalnya, karena waktu tunggu habis) dan perubahan yang diminta mungkin tidak di-roll back di semua komponen lingkungan (seperti server web Airflow).
Misalnya, operasi update mungkin menginstal atau menghapus modul PyPI tambahan, menentukan ulang atau menentukan variabel lingkungan Airflow atau Cloud Composer baru, atau mengubah beberapa parameter terkait Airflow.
Situasi tersebut dapat terjadi jika operasi update dipicu saat operasi lain sedang berlangsung, misalnya penskalaan otomatis cluster Cloud Composer atau operasi pemeliharaan.
Dalam situasi seperti itu, sebaiknya ulangi operasi.
Durasi operasi update atau upgrade
Sebagian besar operasi update atau upgrade memerlukan mulai ulang komponen Airflow seperti penjadwal Airflow, pekerja, dan server web.
Setelah dimulai ulang, komponen harus diinisialisasi. Selama
inisialisasi, penjadwal dan pekerja Airflow mendownload konten folder /dags
dan /plugins
dari bucket lingkungan. Proses sinkronisasi file ke penjadwal dan pekerja Airflow tidak instan dan bergantung pada total ukuran dan jumlah semua objek dalam folder ini.
Sebaiknya hanya simpan file DAG dan plugin di folder /dags
dan /plugins
(masing-masing) dan hapus semua file lainnya. Terlalu banyak data
di folder /dags
dan /plugins
dapat memperlambat inisialisasi komponen
Airflow dan dalam kasus tertentu dapat membuat inisialisasi tidak dapat dilakukan.
Sebaiknya simpan data kurang dari 30 MB di folder /dags
dan /plugins
, dan pastikan tidak melebihi ukuran data 100 MB.
Untuk informasi selengkapnya, lihat juga:
Mengupgrade jenis mesin untuk node GKE
Anda dapat mengupgrade jenis mesin untuk cluster GKE lingkungan secara manual dengan menghapus default-pool
yang ada dan membuat default-pool
baru dengan jenis mesin yang diinginkan.
Sebaiknya tentukan jenis mesin yang sesuai untuk jenis komputasi yang terjadi di lingkungan Cloud Composer saat Anda membuat lingkungan.
Jika menjalankan tugas yang melakukan komputasi yang membutuhkan banyak resource, sebaiknya gunakan Operator GKE.
Setelah upgrade, jenis mesin sebelumnya masih tercantum dalam detail lingkungan Anda. Misalnya, halaman detail Lingkungan tidak mencerminkan jenis mesin baru.
Konsol
Untuk mengupgrade jenis mesin:
Di konsol Google Cloud, buka halaman Environments.
Di daftar lingkungan, klik nama lingkungan Anda. Halaman Environment details akan terbuka.
Dapatkan informasi tentang node pool default:
Buka tab Konfigurasi lingkungan.
Klik link lihat detail cluster.
Di halaman Cluster di bagian Nodes, klik default-pool.
Perhatikan semua informasi untuk default-pool di halaman Detail node pool. Anda akan menggunakan informasi ini untuk membuat kumpulan node default baru untuk lingkungan Anda.
Untuk menghapus default-pool:
Di halaman Node pool details, klik panah kembali untuk kembali ke halaman Clusters untuk lingkungan Anda.
Di bagian Node Pools, klik ikon tempat sampah untuk default-pool. Kemudian, klik Hapus untuk mengonfirmasi operasi.
Untuk membuat default-pool baru:
Di halaman Clusters, klik Add node pool.
Untuk Nama, masukkan
default-pool
. Anda harus menggunakan namadefault-pool
agar alur kerja di lingkungan Anda dapat berjalan di kumpulan ini.Masukkan setelan Ukuran dan Node.
(Hanya untuk akun layanan Compute Engine default) Untuk cakupan akses, pilih Allow full access to all Cloud APIs.
Klik Simpan.
Jika Anda melihat bahwa beban kerja didistribusikan secara tidak merata, skalakan ke bawah deployment pekerja aliran data menjadi nol, lalu skalakan ke atas lagi.