Cloud Composer 1 | Cloud Composer 2 | Cloud Composer 3
Halaman ini menjelaskan cara membuat lingkungan Cloud Composer.
- Untuk mengetahui informasi selengkapnya tentang lingkungan, lihat Arsitektur lingkungan.
- Untuk mengetahui informasi selengkapnya tentang cara membuat lingkungan dengan Terraform, lihat Membuat lingkungan (Terraform).
Sebelum memulai
Aktifkan Cloud Composer API. Untuk mengetahui daftar lengkap layanan yang digunakan oleh Cloud Composer, lihat Layanan yang diperlukan oleh Cloud Composer.
Perkiraan waktu untuk membuat lingkungan adalah 25 menit.
Jika Anda membuat lingkungan dengan Terraform, akun layanan yang digunakan oleh Terraform harus memiliki peran dengan izin
composer.environments.create
diaktifkan.Untuk mengetahui informasi selengkapnya tentang akun layanan untuk Terraform, lihat Referensi Konfigurasi Penyedia Google.
Untuk informasi selengkapnya tentang cara menggunakan Terraform untuk membuat lingkungan Cloud Composer, lihat dokumentasi Terraform.
Untuk mengetahui informasi selengkapnya tentang parameter tambahan, lihat Referensi Argumen Terraform.
IP Pribadi: Ada persyaratan jaringan dan peering tertentu untuk membuat lingkungan IP Pribadi. Untuk informasi selengkapnya, lihat Mengonfigurasi IP pribadi.
VPC Bersama: Ada persyaratan jaringan tertentu untuk menggunakan VPC Bersama dengan Cloud Composer. Untuk mengetahui informasinya, lihat Mengonfigurasi VPC bersama.
VPC SC: Untuk men-deploy lingkungan Cloud Composer di dalam perimeter keamanan, lihat Mengonfigurasi VPC SC. Saat digunakan dengan Cloud Composer, Kontrol Layanan VPC memiliki beberapa batasan yang diketahui.
Langkah 1. Membuat atau memilih akun layanan lingkungan
Saat membuat lingkungan, Anda harus menentukan akun layanan. Akun layanan ini disebut akun layanan lingkungan. Lingkungan Anda menggunakan akun layanan ini untuk melakukan sebagian besar operasi.
Akun layanan untuk lingkungan Anda bukan akun pengguna. Akun layanan adalah jenis akun khusus yang digunakan oleh aplikasi atau instance virtual machine (VM), bukan orang.
Anda tidak dapat mengubah akun layanan lingkungan Anda nanti.
Jika Anda belum memiliki akun layanan untuk lingkungan Cloud Composer di project, buat akun layanan.
Lihat Membuat lingkungan (Terraform) untuk contoh lengkap pembuatan akun layanan untuk lingkungan Anda di Terraform.
Untuk membuat akun layanan baru untuk lingkungan Anda:
Buat akun layanan baru seperti yang dijelaskan dalam dokumentasi Identity and Access Management.
Berikan peran ke akun tersebut, seperti yang dijelaskan dalam dokumentasi Identity and Access Management. Peran yang diperlukan adalah Pekerja Composer (
composer.worker
).Untuk mengakses resource lain di project Google Cloud Anda, berikan izin tambahan untuk mengakses resource tersebut ke akun layanan ini. Peran Pekerja Composer (
composer.worker
) menyediakan kumpulan izin yang diperlukan ini dalam sebagian besar kasus. Tambahkan izin tambahan ke akun layanan ini hanya jika diperlukan untuk pengoperasian DAG Anda.
Langkah 2. Penyiapan dasar
Langkah ini akan membuat lingkungan Cloud Composer dengan parameter default di lokasi yang ditentukan.
Konsol
Di konsol Google Cloud, buka halaman Create environment.
Di kolom Nama, masukkan nama untuk lingkungan Anda.
Nama harus dimulai dengan huruf kecil, diikuti dengan maksimal 62 huruf kecil, angka, atau tanda hubung, dan tidak boleh diakhiri dengan tanda hubung. Nama lingkungan digunakan untuk membuat subkomponen untuk lingkungan, sehingga Anda harus memberikan nama yang juga valid sebagai nama bucket Cloud Storage. Lihat Panduan penamaan bucket untuk mengetahui daftar pembatasan.
Di menu drop-down Location, pilih lokasi untuk lingkungan Anda.
Lokasi adalah region tempat lingkungan berada.
Di menu drop-down Image version, pilih Cloud Composer image dengan versi Airflow yang diperlukan.
Di menu drop-down Service account, pilih akun layanan untuk lingkungan Anda.
Jika Anda belum memiliki akun layanan untuk lingkungan, lihat Membuat atau memilih akun layanan lingkungan.
gcloud
gcloud composer environments create ENVIRONMENT_NAME \
--location LOCATION \
--image-version IMAGE_VERSION \
--service-account "SERVICE_ACCOUNT"
Ganti:
ENVIRONMENT_NAME
dengan nama lingkungan.Nama harus dimulai dengan huruf kecil, diikuti dengan maksimal 62 huruf kecil, angka, atau tanda hubung, dan tidak boleh diakhiri dengan tanda hubung. Nama lingkungan digunakan untuk membuat subkomponen untuk lingkungan, sehingga Anda harus memberikan nama yang juga valid sebagai nama bucket Cloud Storage. Lihat Panduan penamaan bucket untuk mengetahui daftar pembatasan.
LOCATION
dengan region untuk lingkungan.Lokasi adalah region tempat lingkungan berada.
SERVICE_ACCOUNT
dengan akun layanan untuk lingkungan Anda.IMAGE_VERSION
dengan nama image Cloud Composer.
Contoh:
gcloud composer environments create example-environment \
--location us-central1 \
--image-version composer-2.9.11-airflow-2.9.3 \
--service-account "
example-account@example-project.iam.gserviceaccount.com
"
API
Buat permintaan API environments.create
. Tentukan konfigurasi dalam resource Environment
.
{
"name": "projects/PROJECT_ID/locations/LOCATION/environments/ENVIRONMENT_NAME",
"config": {
"softwareConfig": {
"imageVersion": "IMAGE_VERSION"
},
"nodeConfig": {
"serviceAccount": "SERVICE_ACCOUNT"
}
}
}
Ganti:
PROJECT_ID
dengan Project ID.LOCATION
dengan region untuk lingkungan.Lokasi adalah region tempat lingkungan berada.
ENVIRONMENT_NAME
dengan nama lingkungan.Nama harus dimulai dengan huruf kecil, diikuti dengan maksimal 62 huruf kecil, angka, atau tanda hubung, dan tidak boleh diakhiri dengan tanda hubung. Nama lingkungan digunakan untuk membuat subkomponen untuk lingkungan, sehingga Anda harus memberikan nama yang juga valid sebagai nama bucket Cloud Storage. Lihat Panduan penamaan bucket untuk mengetahui daftar pembatasan.
IMAGE_VERSION
dengan nama image Cloud Composer.SERVICE_ACCOUNT
dengan akun layanan untuk lingkungan Anda.
Contoh:
// POST https://composer.googleapis.com/v1/{parent=projects/*/locations/*}/environments
{
"name": "projects/example-project/locations/us-central1/environments/example-environment",
"config": {
"softwareConfig": {
"imageVersion": "composer-2.9.11-airflow-2.9.3"
},
"nodeConfig": {
"serviceAccount": "
example-account@example-project.iam.gserviceaccount.com
"
}
}
}
Terraform
Untuk membuat lingkungan dengan parameter default di lokasi yang ditentukan,
tambahkan blok resource berikut ke konfigurasi Terraform Anda dan jalankan
terraform apply
.
resource "google_composer_environment" "example" {
provider = google-beta
name = "ENVIRONMENT_NAME"
region = "LOCATION"
config {
software_config {
image_version = "IMAGE_VERSION"
}
node_config {
service_account = "SERVICE_ACCOUNT"
}
}
}
Ganti:
ENVIRONMENT_NAME
dengan nama lingkungan.Nama harus dimulai dengan huruf kecil, diikuti dengan maksimal 62 huruf kecil, angka, atau tanda hubung, dan tidak boleh diakhiri dengan tanda hubung. Nama lingkungan digunakan untuk membuat subkomponen untuk lingkungan, sehingga Anda harus memberikan nama yang juga valid sebagai nama bucket Cloud Storage. Lihat Panduan penamaan bucket untuk mengetahui daftar pembatasan.
LOCATION
dengan region untuk lingkungan.Lokasi adalah region tempat lingkungan berada.
IMAGE_VERSION
dengan nama image Cloud Composer.SERVICE_ACCOUNT
dengan akun layanan untuk lingkungan Anda.
Contoh:
resource "google_composer_environment" "example" {
provider = google-beta
name = "example-environment"
region = "us-central1"
config {
software_config {
image_version = "composer-2.9.11-airflow-2.9.3"
}
node_config {
service_account = "
example-account@example-project.iam.gserviceaccount.com
"
}
}
}
Langkah 3. Memberikan izin yang diperlukan ke akun layanan Cloud Composer
Saat Anda mengaktifkan Cloud Composer API di project, akun Agen Layanan Composer akan dibuat di project Anda. Cloud Composer menggunakan akun ini untuk melakukan operasi di project Google Cloud Anda.
Peran Ekstensi Agen Layanan Cloud Composer v2 API memberikan izin tambahan ke akun Agen Layanan Cloud Composer. Peran ini tidak diberikan secara otomatis. Anda harus memberikannya secara manual.
Konsol
Saat Anda membuat lingkungan di project, jika Agen Layanan Cloud Composer tidak memiliki izin yang diperlukan di akun layanan lingkungan, bagian Berikan izin yang diperlukan ke akun layanan Cloud Composer akan muncul.
Anda menambahkan akun Agen Layanan Cloud Composer sebagai akun utama baru di akun layanan lingkungan dan memberikan peran Ekstensi Agen Layanan Cloud Composer v2 API ke akun tersebut.
Pastikan Anda menggunakan akun layanan yang dimaksud untuk lingkungan Anda, lalu klik Berikan.
gcloud
Anda menambahkan akun Agen Layanan Cloud Composer sebagai akun utama baru di akun layanan lingkungan dan memberikan peran Ekstensi Agen Layanan Cloud Composer v2 API ke akun tersebut.
gcloud iam service-accounts add-iam-policy-binding \
SERVICE_ACCOUNT \
--member serviceAccount:service-PROJECT_NUMBER@cloudcomposer-accounts.iam.gserviceaccount.com \
--role roles/composer.ServiceAgentV2Ext
Ganti:
SERVICE_ACCOUNT
dengan akun layanan untuk lingkungan Anda.PROJECT_NUMBER
dengan Nomor project.
Contoh:
gcloud iam service-accounts add-iam-policy-binding \
example-account@example-project.iam.gserviceaccount.com \
--member serviceAccount:service-00000000000@cloudcomposer-accounts.iam.gserviceaccount.com \
--role roles/composer.ServiceAgentV2Ext
API
Untuk memberikan peran, Anda harus mengubah kebijakan izin yang ada menggunakan pola baca-ubah-tulis:
- Baca kebijakan izin yang ada untuk akun layanan lingkungan Anda.
- Ubah untuk menyertakan peran
roles/composer.ServiceAgentV2Ext
untuk Agen Layanan Cloud Composer. - Tulis ulang kebijakan izin yang ada.
Untuk informasi selengkapnya, lihat Mengontrol akses secara terprogram.
{
"role": "roles/composer.ServiceAgentV2Ext",
"members": [
"serviceAccount:service-PROJECT_NUMBER@cloudcomposer-accounts.iam.gserviceaccount.com"
]
}
Ganti:
PROJECT_NUMBER
dengan Nomor project.
Contoh:
{
"role": "roles/composer.ServiceAgentV2Ext",
"members": [
"serviceAccount:service-00000000000@cloudcomposer-accounts.iam.gserviceaccount.com"
]
}
Terraform
Tambahkan binding peran baru ke kebijakan izin akun layanan lingkungan Anda.
Anda menambahkan akun Agen Layanan Cloud Composer sebagai akun utama baru di akun layanan lingkungan dan memberikan peran Ekstensi Agen Layanan Cloud Composer v2 API ke akun tersebut.
Jika Anda tidak menggunakan Terraform untuk menentukan kebijakan izin akun layanan lingkungan, jangan gunakan contoh berikut. Sebagai gantinya, tambahkan binding ini menggunakan metode lain.
resource "google_service_account_iam_member" "custom_service_account" {
provider = google-beta
service_account_id = "SERVICE_ACCOUNT"
role = "roles/composer.ServiceAgentV2Ext"
member = "serviceAccount:service-PROJECT_NUMBER@cloudcomposer-accounts.iam.gserviceaccount.com"
}
Ganti:
SERVICE_ACCOUNT
dengan akun layanan untuk lingkungan Anda.PROJECT_NUMBER
dengan Nomor project.
Contoh:
resource "google_service_account_iam_member" "custom_service_account" {
provider = google-beta
service_account_id = "example-account@example-project.iam.gserviceaccount.com"
role = "roles/composer.ServiceAgentV2Ext"
member = "serviceAccount:service-00000000000@cloudcomposer-accounts.iam.gserviceaccount.com"
}
Langkah 4. (Opsional) Mengonfigurasi parameter performa dan skala lingkungan
Untuk menentukan konfigurasi skala dan performa untuk lingkungan Anda, pilih ukuran lingkungan dan konfigurasi workload.
Anda dapat mengubah semua parameter performa dan skala setelah membuat lingkungan.
Parameter berikut mengontrol skala dan performa:
Ukuran lingkungan. Mengontrol parameter performa infrastruktur Cloud Composer terkelola yang menyertakan database Airflow. Pertimbangkan untuk memilih ukuran lingkungan yang lebih besar jika Anda ingin menjalankan sejumlah besar DAG dan tugas dengan performa infrastruktur yang lebih tinggi. Misalnya, ukuran lingkungan yang lebih besar akan meningkatkan jumlah entri log tugas Airflow yang dapat diproses lingkungan Anda dengan penundaan minimal.
Konfigurasi beban kerja. Mengontrol skala dan performa komponen lingkungan yang berjalan di cluster GKE: penjadwal Airflow, server web Airflow, dan pekerja Airflow.
Penjadwal Airflow. Mengurai file definisi DAG, menjadwalkan DAG berjalan berdasarkan interval jadwal, dan mengantrekan tugas untuk dieksekusi oleh pekerja Airflow.
Lingkungan Anda dapat menjalankan lebih dari satu penjadwal Airflow secara bersamaan. Gunakan beberapa penjadwal untuk mendistribusikan beban di antara beberapa instance penjadwal untuk performa dan keandalan yang lebih baik.
Meningkatkan jumlah penjadwal tidak selalu meningkatkan performa Airflow. Misalnya, hanya memiliki satu penjadwal mungkin memberikan performa yang lebih baik daripada memiliki dua. Hal ini dapat terjadi jika penjadwal tambahan tidak digunakan, sehingga menggunakan resource lingkungan Anda tanpa berkontribusi pada performa secara keseluruhan. Performa penjadwal sebenarnya bergantung pada jumlah pekerja Airflow, jumlah DAG dan tugas yang berjalan di lingkungan Anda, serta konfigurasi Airflow dan lingkungan.
Sebaiknya mulai dengan dua penjadwal, lalu pantau performa lingkungan Anda. Jika mengubah jumlah penjadwal, Anda selalu dapat menskalakan lingkungan kembali ke jumlah penjadwal awal.
Untuk informasi selengkapnya tentang cara mengonfigurasi beberapa penjadwal, lihat dokumentasi Airflow.
Pemicu Airflow. Memantau semua tugas yang ditangguhkan secara asinkron di lingkungan Anda. Jika memiliki minimal satu instance pemicu di lingkungan (atau minimal dua di lingkungan yang sangat tangguh), Anda dapat menggunakan operator yang dapat ditangguhkan di DAG.
Server web Airflow. Menjalankan antarmuka web Airflow tempat Anda dapat memantau, mengelola, dan memvisualisasikan DAG.
Pekerja Airflow. Menjalankan tugas yang dijadwalkan oleh penjadwal Airflow. Jumlah minimum dan maksimum pekerja di lingkungan Anda berubah secara dinamis, bergantung pada jumlah tugas dalam antrean.
Konsol
Anda dapat memilih preset untuk lingkungan Anda. Saat Anda memilih preset, skala dan parameter performa untuk preset tersebut akan otomatis dipilih. Anda juga memiliki opsi untuk memilih preset kustom dan menentukan semua parameter skala dan performa untuk lingkungan Anda.
Untuk memilih konfigurasi skala dan performa untuk lingkungan Anda, di halaman Create environment:
Untuk menggunakan nilai standar, di bagian Environment resources, klik Small, Medium, atau Large.
Untuk menentukan nilai kustom untuk parameter skala dan performa:
Di bagian Environment resources, klik Custom.
Di bagian Penjadwal, tetapkan jumlah penjadwal yang ingin Anda gunakan, dan alokasi resource untuk CPU, memori, dan penyimpanannya.
Di bagian Pemicu, gunakan kolom Jumlah pemicu untuk memasukkan jumlah pemicu di lingkungan Anda. Anda dapat menetapkan angka ini ke 0 jika tidak ingin menggunakan operator yang dapat ditangguhkan di DAG.
Jika Anda menetapkan minimal satu pemicu untuk lingkungan, gunakan kolom CPU dan Memory untuk mengonfigurasi alokasi resource untuk pemicu Anda.
Di bagian DAG processor, tentukan jumlah pemroses DAG di lingkungan Anda dan jumlah CPU, memori, dan penyimpanan untuk setiap pemroses DAG.
Di bagian Server web, tentukan jumlah CPU, memori, dan penyimpanan untuk server web.
Di bagian Worker, tentukan:
- Jumlah minimum dan maksimum pekerja untuk batas penskalaan otomatis di lingkungan Anda.
- Alokasi CPU, memori, dan penyimpanan untuk pekerja Anda
Di bagian Infrastruktur inti, di menu drop-down Ukuran lingkungan, pilih ukuran lingkungan.
gcloud
Saat Anda membuat lingkungan, argumen berikut akan mengontrol parameter skala dan performa lingkungan Anda.
--environment-size
menentukan ukuran lingkungan.--scheduler-count
menentukan jumlah penjadwal.--scheduler-cpu
menentukan jumlah CPU untuk penjadwal Airflow.--scheduler-memory
menentukan jumlah memori untuk penjadwal Airflow.--scheduler-storage
menentukan jumlah ruang disk untuk penjadwal Airflow.--triggerer-count
menentukan jumlah pemicu Airflow di lingkungan Anda. Nilai default untuk flag ini adalah0
. Anda memerlukan pemicu jika ingin menggunakan operator yang dapat ditangguhkan di DAG.- Untuk lingkungan ketahanan standar, gunakan nilai antara
0
dan10
. - Untuk lingkungan yang sangat tangguh, gunakan
0
atau nilai antara2
dan10
.
- Untuk lingkungan ketahanan standar, gunakan nilai antara
--triggerer-cpu
menentukan jumlah CPU untuk pemicu Airflow, dalam unit vCPU. Nilai yang diizinkan:0.5
,0.75
,1
. Nilai default-nya adalah0.5
.--triggerer-memory
menentukan jumlah memori untuk pemicu Airflow, dalam GB. Nilai defaultnya adalah0.5
.Memori minimum yang diperlukan sama dengan jumlah CPU yang dialokasikan untuk pemicu. Nilai maksimum yang diizinkan sama dengan jumlah CPU pemicu yang dikalikan dengan 6,5.
Misalnya, jika Anda menetapkan flag
--triggerer-cpu
ke1
, nilai minimum untuk--triggerer-memory
adalah1
dan nilai maksimum adalah6.5
.--web-server-cpu
menentukan jumlah CPU untuk server web Airflow.--web-server-memory
menentukan jumlah memori untuk server web Airflow.--web-server-storage
menentukan jumlah ruang disk untuk server web Airflow.--worker-cpu
menentukan jumlah CPU untuk pekerja Airflow.--worker-memory
menentukan jumlah memori untuk pekerja Airflow.--worker-storage
menentukan jumlah ruang disk untuk pekerja Airflow.--min-workers
menentukan jumlah minimum pekerja Airflow. Cluster lingkungan Anda menjalankan setidaknya jumlah pekerja ini.--max-workers
menentukan jumlah maksimum pekerja Airflow. Cluster lingkungan Anda berjalan dengan jumlah pekerja maksimal ini.
gcloud composer environments create ENVIRONMENT_NAME \
--location LOCATION \
--image-version composer-2.9.11-airflow-2.9.3 \
--service-account "SERVICE_ACCOUNT" \
--environment-size ENVIRONMENT_SIZE \
--scheduler-count SCHEDULER_COUNT \
--scheduler-cpu SCHEDULER_CPU \
--scheduler-memory SCHEDULER_MEMORY \
--scheduler-storage SCHEDULER_STORAGE \
--triggerer-count TRIGGERER_COUNT \
--triggerer-cpu TRIGGERER_CPU \
--triggerer-memory TRIGGERER_MEMORY \
--web-server-cpu WEB_SERVER_CPU \
--web-server-memory WEB_SERVER_MEMORY \
--web-server-storage WEB_SERVER_STORAGE \
--worker-cpu WORKER_CPU \
--worker-memory WORKER_MEMORY \
--worker-storage WORKER_STORAGE \
--min-workers WORKERS_MIN \
--max-workers WORKERS_MAX
Ganti:
ENVIRONMENT_SIZE
dengansmall
,medium
, ataularge
.SCHEDULER_COUNT
dengan jumlah penjadwal.SCHEDULER_CPU
dengan jumlah CPU untuk penjadwal, dalam unit vCPU.SCHEDULER_MEMORY
dengan jumlah memori untuk penjadwal.SCHEDULER_STORAGE
dengan ukuran disk untuk penjadwal.TRIGGERER_COUNT
dengan jumlah pemicu.TRIGGERER_CPU
dengan jumlah CPU untuk pemicu, dalam unit vCPU.TRIGGERER_MEMORY
dengan jumlah memori untuk pemicu, dalam GB.WEB_SERVER_CPU
dengan jumlah CPU untuk server web, dalam unit vCPU.WEB_SERVER_MEMORY
dengan jumlah memori untuk server web.WEB_SERVER_STORAGE
dengan jumlah memori untuk server web.WORKER_CPU
dengan jumlah CPU untuk pekerja, dalam unit vCPU.WORKER_MEMORY
dengan jumlah memori untuk pekerja.WORKER_STORAGE
dengan ukuran disk untuk pekerja.WORKERS_MIN
dengan jumlah minimum pekerja Airflow yang dapat dijalankan oleh lingkungan Anda. Jumlah pekerja di lingkungan Anda tidak melebihi jumlah ini, meskipun jumlah pekerja yang lebih rendah dapat menangani beban.WORKERS_MAX
dengan jumlah maksimum pekerja Airflow yang dapat dijalankan oleh lingkungan Anda. Jumlah pekerja di lingkungan Anda tidak melebihi jumlah ini, meskipun jumlah pekerja yang lebih tinggi diperlukan untuk menangani beban.
Contoh:
gcloud composer environments create example-environment \
--location us-central1 \
--image-version composer-2.9.11-airflow-2.9.3 \
--service-account "
example-account@example-project.iam.gserviceaccount.com
" \
--environment-size small \
--scheduler-count 1 \
--scheduler-cpu 0.5 \
--scheduler-memory 2.5GB \
--scheduler-storage 2GB \
--triggerer-count 1 \
--triggerer-cpu 0.5 \
--triggerer-memory 0.5GB \
--web-server-cpu 1 \
--web-server-memory 2.5GB \
--web-server-storage 2GB \
--worker-cpu 1 \
--worker-memory 2GB \
--worker-storage 2GB \
--min-workers 2 \
--max-workers 4
API
Saat membuat lingkungan, di resource Environment > EnvironmentConfig > WorkloadsConfig, tentukan parameter performa dan skala lingkungan.
{
"name": "projects/PROJECT_ID/locations/LOCATION/environments/ENVIRONMENT_NAME",
"config": {
"workloadsConfig": {
"scheduler": {
"cpu": SCHEDULER_CPU,
"memoryGb": SCHEDULER_MEMORY,
"storageGb": SCHEDULER_STORAGE,
"count": SCHEDULER_COUNT
},
"triggerer": {
"count": TRIGGERER_COUNT,
"cpu": TRIGGERER_CPU,
"memoryGb": TRIGGERER_MEMORY
},
"webServer": {
"cpu": WEB_SERVER_CPU,
"memoryGb": WEB_SERVER_MEMORY,
"storageGb": WEB_SERVER_STORAGE
},
"worker": {
"cpu": WORKER_CPU,
"memoryGb": WORKER_MEMORY,
"storageGb": WORKER_STORAGE,
"minCount": WORKERS_MIN,
"maxCount": WORKERS_MAX
}
},
"environmentSize": "ENVIRONMENT_SIZE",
"nodeConfig": {
"serviceAccount": "SERVICE_ACCOUNT"
}
}
}
Ganti:
SCHEDULER_CPU
dengan jumlah CPU untuk penjadwal, dalam unit vCPU.SCHEDULER_MEMORY
dengan jumlah memori untuk penjadwal, dalam GB.SCHEDULER_STORAGE
dengan ukuran disk untuk penjadwal, dalam GB.SCHEDULER_COUNT
dengan jumlah penjadwal.TRIGGERER_COUNT
dengan jumlah pemicu. Nilai defaultnya adalah0
. Anda memerlukan pemicu jika ingin menggunakan operator yang dapat ditangguhkan di DAG.- Untuk lingkungan ketahanan standar, gunakan nilai antara
0
dan10
. - Untuk lingkungan yang sangat tangguh, gunakan
0
atau nilai antara2
dan10
.
Jika menggunakan minimal satu pemicu, Anda juga harus menentukan parameter
TRIGGERER_CPU
danTRIGGERER_MEMORY
:- Untuk lingkungan ketahanan standar, gunakan nilai antara
TRIGGERER_CPU
menentukan jumlah CPU untuk pemicu, dalam unit vCPU. Nilai yang diizinkan:0.5
,0.75
,1
.TRIGGERER_MEMORY
mengonfigurasi jumlah memori untuk pemicu. Memori minimum yang diperlukan sama dengan jumlah CPU yang dialokasikan untuk pemicu. Nilai maksimum yang diizinkan sama dengan jumlah CPU pemicu yang dikalikan dengan 6,5.Misalnya, jika Anda menetapkan
TRIGGERER_CPU
ke1
, nilai minimum untukTRIGGERER_MEMORY
adalah1
dan nilai maksimum adalah6.5
.WEB_SERVER_CPU
dengan jumlah CPU untuk server web, dalam unit vCPU.WEB_SERVER_MEMORY
dengan jumlah memori untuk server web, dalam GB.WEB_SERVER_STORAGE
dengan ukuran disk untuk server web, dalam GB.WORKER_CPU
dengan jumlah CPU untuk pekerja, dalam unit vCPU.WORKER_MEMORY
dengan jumlah memori untuk pekerja, dalam GB.WORKER_STORAGE
dengan ukuran disk untuk pekerja, dalam GB.WORKERS_MIN
dengan jumlah minimum pekerja Airflow yang dapat dijalankan oleh lingkungan Anda. Jumlah pekerja di lingkungan Anda tidak melebihi jumlah ini, meskipun jumlah pekerja yang lebih rendah dapat menangani beban.WORKERS_MAX
dengan jumlah maksimum pekerja Airflow yang dapat dijalankan oleh lingkungan Anda. Jumlah pekerja di lingkungan Anda tidak melebihi jumlah ini, meskipun jumlah pekerja yang lebih tinggi diperlukan untuk menangani beban.ENVIRONMENT_SIZE
dengan ukuran lingkungan,ENVIRONMENT_SIZE_SMALL
,ENVIRONMENT_SIZE_MEDIUM
, atauENVIRONMENT_SIZE_LARGE
.
Contoh:
// POST https://composer.googleapis.com/v1/{parent=projects/*/locations/*}/environments
{
"name": "projects/example-project/locations/us-central1/environments/example-environment",
"config": {
"workloadsConfig": {
"scheduler": {
"cpu": 2.5,
"memoryGb": 2.5,
"storageGb": 2,
"count": 1
},
"triggerer": {
"cpu": 0.5,
"memoryGb": 0.5,
"count": 1
},
"webServer": {
"cpu": 1,
"memoryGb": 2.5,
"storageGb": 2
},
"worker": {
"cpu": 1,
"memoryGb": 2,
"storageGb": 2,
"minCount": 2,
"maxCount": 4
}
},
"environmentSize": "ENVIRONMENT_SIZE_SMALL",
"nodeConfig": {
"serviceAccount": "
example-account@example-project.iam.gserviceaccount.com
"
}
}
}
Terraform
Saat Anda membuat lingkungan, argumen berikut akan mengontrol parameter skala dan performa lingkungan Anda.
Di blok
config
:- Kolom
environment_size
mengontrol ukuran lingkungan.
- Kolom
Di blok
workloads_config
:- Kolom
scheduler.cpu
menentukan jumlah CPU untuk penjadwal Airflow. - Kolom
scheduler.memory_gb
menentukan jumlah memori untuk penjadwal Airflow. - Kolom
scheduler.storage_gb
menentukan jumlah ruang disk untuk penjadwal. - Kolom
scheduler.count
menentukan jumlah penjadwal di lingkungan Anda. - Kolom
triggerer.cpu
menentukan jumlah CPU untuk pemicu Airflow. - Kolom
triggerer.memory_gb
menentukan jumlah memori untuk pemicu Airflow. Kolom
triggerer.count
menentukan jumlah pemicu di lingkungan Anda.Kolom
web_server.cpu
menentukan jumlah CPU untuk server web Airflow.Kolom
web_server.memory_gb
menentukan jumlah memori untuk server web Airflow.Kolom
web_server.storage_gb
menentukan jumlah ruang disk untuk server web Airflow.Kolom
worker.cpu
menentukan jumlah CPU untuk pekerja Airflow.Kolom
worker.memory_gb
menentukan jumlah memori untuk pekerja Airflow.Kolom
worker.storage_gb
menentukan jumlah ruang disk untuk pekerja Airflow.Kolom
worker.min_count
menentukan jumlah minimum pekerja di lingkungan Anda.Kolom
worker.max_count
menentukan jumlah maksimum pekerja di lingkungan Anda.
- Kolom
resource "google_composer_environment" "example" {
provider = google-beta
name = "ENVIRONMENT_NAME"
region = "LOCATION"
config {
workloads_config {
scheduler {
cpu = SCHEDULER_CPU
memory_gb = SCHEDULER_MEMORY
storage_gb = SCHEDULER_STORAGE
count = SCHEDULER_COUNT
}
triggerer {
count = TRIGGERER_COUNT
cpu = TRIGGERER_CPU
memory_gb = TRIGGERER_MEMORY
}
web_server {
cpu = WEB_SERVER_CPU
memory_gb = WEB_SERVER_MEMORY
storage_gb = WEB_SERVER_STORAGE
}
worker {
cpu = WORKER_CPU
memory_gb = WORKER_MEMORY
storage_gb = WORKER_STORAGE
min_count = WORKERS_MIN
max_count = WORKERS_MAX
}
}
environment_size = "ENVIRONMENT_SIZE"
node_config {
service_account = "SERVICE_ACCOUNT"
}
}
}
Ganti:
ENVIRONMENT_NAME
dengan nama lingkungan.LOCATION
dengan region tempat lingkungan tersebut berada.SERVICE_ACCOUNT
dengan akun layanan untuk lingkungan Anda.SCHEDULER_CPU
dengan jumlah CPU untuk penjadwal, dalam unit vCPU.SCHEDULER_MEMORY
dengan jumlah memori untuk penjadwal, dalam GB.SCHEDULER_STORAGE
dengan ukuran disk untuk penjadwal, dalam GB.SCHEDULER_COUNT
dengan jumlah penjadwal.TRIGGERER_COUNT
dengan jumlah pemicu.TRIGGERER_CPU
dengan jumlah CPU untuk pemicu, dalam unit vCPU.TRIGGERER_MEMORY
dengan jumlah memori untuk pemicu, dalam GB.WEB_SERVER_CPU
dengan jumlah CPU untuk server web, dalam unit vCPU.WEB_SERVER_MEMORY
dengan jumlah memori untuk server web, dalam GB.WEB_SERVER_STORAGE
dengan ukuran disk untuk server web, dalam GB.WORKER_CPU
dengan jumlah CPU untuk pekerja, dalam unit vCPU.WORKER_MEMORY
dengan jumlah memori untuk pekerja, dalam GB.WORKER_STORAGE
dengan ukuran disk untuk pekerja, dalam GB.WORKERS_MIN
dengan jumlah minimum pekerja Airflow yang dapat dijalankan oleh lingkungan Anda. Jumlah pekerja di lingkungan Anda tidak melebihi jumlah ini, meskipun jumlah pekerja yang lebih rendah dapat menangani beban.WORKERS_MAX
dengan jumlah maksimum pekerja Airflow yang dapat dijalankan oleh lingkungan Anda. Jumlah pekerja di lingkungan Anda tidak melebihi jumlah ini, meskipun jumlah pekerja yang lebih tinggi diperlukan untuk menangani beban.ENVIRONMENT_SIZE
dengan ukuran lingkungan,ENVIRONMENT_SIZE_SMALL
,ENVIRONMENT_SIZE_MEDIUM
, atauENVIRONMENT_SIZE_LARGE
.
Contoh:
resource "google_composer_environment" "example" {
provider = google-beta
name = "example-environment"
region = "us-central1"
config {
workloads_config {
scheduler {
cpu = 2.5
memory_gb = 2.5
storage_gb = 2
count = 1
}
triggerer {
count = 1
cpu = 0.5
memory_gb = 0.5
}
web_server {
cpu = 1
memory_gb = 2.5
storage_gb = 2
}
worker {
cpu = 1
memory_gb = 2
storage_gb = 2
min_count = 2
max_count = 4
}
}
environment_size = "ENVIRONMENT_SIZE_SMALL"
node_config {
service_account = "
example-account@example-project.iam.gserviceaccount.com
"
}
}
}
Langkah 5. (Opsional) Mengaktifkan mode ketahanan tinggi
Lingkungan Cloud Composer yang sangat tangguh adalah lingkungan yang menggunakan mekanisme redundansi dan failover bawaan yang mengurangi kerentanan lingkungan terhadap kegagalan zona dan pemadaman layanan titik tunggal kegagalan.
Lingkungan yang sangat tangguh berjalan di setidaknya dua zona dari region yang dipilih. Tepat dua penjadwal Airflow, dua server web, dan setidaknya dua pemicu (jika jumlah pemicu tidak ditetapkan ke 0
) berjalan di zona terpisah.
Jumlah minimum pekerja ditetapkan ke dua, dan cluster lingkungan Anda
mendistribusikan instance pekerja di antara zona. Jika terjadi pemadaman layanan zona, instance pekerja yang terpengaruh akan dijadwalkan ulang di zona lain. Database Cloud SQL
dari lingkungan yang sangat tangguh adalah instance regional yang memiliki
instance utama dan instance standby.
Konsol
Di halaman Create environment:
Di bagian Mode ketahanan, pilih Ketahanan tinggi.
Di bagian Environment resources, pilih parameter skala untuk lingkungan yang sangat tangguh. Lingkungan yang sangat tangguh memerlukan tepat dua penjadwal, nol atau antara dua hingga sepuluh pemicu, dan minimal dua pekerja:
Klik Custom.
Di menu drop-down Number of schedulers, pilih
2
.Di menu drop-down Jumlah pemicu, pilih
0
, atau nilai antara2
dan10
. Konfigurasikan alokasi CPU dan Memori untuk pemicu Anda.Dalam menu drop-down Minimum number of workers, pilih
2
atau lebih, bergantung pada jumlah pekerja yang diperlukan.
Di bagian Network configuration:
Di Networking type, pilih Private IP environment.
Jika diperlukan, tentukan parameter jaringan lainnya.
gcloud
Saat Anda membuat lingkungan, argumen --enable-high-resilience
akan mengaktifkan mode ketahanan tinggi.
Tetapkan argumen berikut:
--enable-high-resilience
--enable-private-environment
, dan parameter jaringan lainnya untuk lingkungan IP Pribadi, jika diperlukan--scheduler-count
ke2
--triggerer-count
hingga0
atau nilai antara2
dan10
. Jika Anda menggunakan pemicu, flag--triggerer-cpu and
--triggerer-memory` juga diperlukan untuk pembuatan lingkungan.Untuk informasi selengkapnya tentang flag
--triggerer-count
,--triggerer-cpu
, dan--triggerer-memory
, lihat Mengonfigurasi parameter skala dan performa lingkungan.--min-workers
hingga2
atau lebih
gcloud composer environments create ENVIRONMENT_NAME \
--location LOCATION \
--image-version composer-2.9.11-airflow-2.9.3 \
--service-account "SERVICE_ACCOUNT" \
--enable-high-resilience \
--enable-private-environment \
--scheduler-count 2 \
--triggerer-count 2 \
--triggerer-cpu 0.5 \
--triggerer-memory 0.5 \
--min-workers 2
API
Saat Anda membuat lingkungan, di resource Environment > EnvironmentConfig, aktifkan mode ketangguhan tinggi.
{
"name": "projects/PROJECT_ID/locations/LOCATION/environments/ENVIRONMENT_NAME",
"config": {
"resilience_mode": "HIGH_RESILIENCE",
"nodeConfig": {
"serviceAccount": "SERVICE_ACCOUNT"
}
}
}
Contoh:
// POST https://composer.googleapis.com/v1/{parent=projects/*/locations/*}/environments
{
"name": "projects/example-project/locations/us-central1/environments/example-environment",
"config": {
"resilience_mode": "HIGH_RESILIENCE",
"nodeConfig": {
"serviceAccount": "
example-account@example-project.iam.gserviceaccount.com
"
}
}
}
Terraform
Saat Anda membuat lingkungan, kolom resilience_mode
di blok config
akan mengaktifkan mode ketahanan tinggi.
resource "google_composer_environment" "example" {
provider = google-beta
name = "ENVIRONMENT_NAME"
region = "LOCATION"
config {
resilience_mode = "HIGH_RESILIENCE"
node_config {
service_account = "SERVICE_ACCOUNT"
}
}
}
Contoh:
resource "google_composer_environment" "example" {
provider = google-beta
name = "example-environment"
region = "us-central1"
config {
resilience_mode = "HIGH_RESILIENCE"
node_config {
service_account = "
example-account@example-project.iam.gserviceaccount.com
"
}
}
}
Langkah 6. (Opsional) Tentukan zona untuk database lingkungan
Anda dapat menentukan zona Cloud SQL pilihan saat membuat lingkungan ketangguhan standar.
Konsol
Di halaman Create environment:
Di bagian Konfigurasi lanjutan, luaskan item Tampilkan konfigurasi lanjutan.
Di daftar Airflow database zone, pilih zona Cloud SQL yang diinginkan.
gcloud
Saat Anda membuat lingkungan, argumen --cloud-sql-preferred-zone
menentukan zona Cloud SQL yang diinginkan.
gcloud composer environments create ENVIRONMENT_NAME \
--location LOCATION \
--image-version composer-2.9.11-airflow-2.9.3 \
--service-account "SERVICE_ACCOUNT" \
--cloud-sql-preferred-zone SQL_ZONE
Ganti kode berikut:
SQL_ZONE
: zona Cloud SQL pilihan. Zona ini harus berada di region tempat lingkungan berada.
Contoh:
gcloud composer environments create example-environment \
--location us-central1 \
--image-version composer-2.9.11-airflow-2.9.3 \
--service-account "
example-account@example-project.iam.gserviceaccount.com
" \
--cloud-sql-preferred-zone us-central1-a
API
Saat Anda membuat lingkungan, di resource Environment > DatabaseConfig, tentukan zona Cloud SQL yang diinginkan.
{
"name": "projects/PROJECT_ID/locations/LOCATION/environments/ENVIRONMENT_NAME",
"config": {
"databaseConfig": {
"zone": "SQL_ZONE"
},
"nodeConfig": {
"serviceAccount": "SERVICE_ACCOUNT"
}
}
}
Ganti kode berikut:
SQL_ZONE
: zona Cloud SQL pilihan. Zona ini harus berada di region tempat lingkungan berada.
Contoh:
// POST https://composer.googleapis.com/v1/{parent=projects/*/locations/*}/environments
{
"name": "projects/example-project/locations/us-central1/environments/example-environment",
"config": {
"databaseConfig": {
"zone": "us-central1-a"
},
"nodeConfig": {
"serviceAccount": "
example-account@example-project.iam.gserviceaccount.com
"
}
}
}
Terraform
Saat Anda membuat lingkungan, kolom zone
di blok database_config
menentukan zona Cloud SQL yang diinginkan.
resource "google_composer_environment" "example" {
provider = google-beta
name = "ENVIRONMENT_NAME"
region = "LOCATION"
config {
database_config {
zone = "SQL_ZONE"
}
node_config {
service_account = "SERVICE_ACCOUNT"
}
}
}
Ganti kode berikut:
SQL_ZONE
: zona Cloud SQL pilihan. Zona ini harus berada di region tempat lingkungan berada.
Langkah 7. (Opsional) Mengonfigurasi jaringan lingkungan Anda
Parameter jaringan bergantung pada jenis lingkungan yang ingin Anda buat:
Lingkungan IP publik. Gunakan parameter jaringan default.
Lingkungan IP pribadi (dengan PSC). Dalam konfigurasi ini, lingkungan Anda menggunakan Private Service Connect untuk konektivitas.
Konfigurasikan lingkungan IP Pribadi Anda:
- Mengonfigurasi jaringan project untuk lingkungan IP Pribadi.
- Konfigurasi Private Service Connect saat Anda membuat lingkungan.
- Tentukan parameter lain untuk lingkungan IP Pribadi Anda, seperti yang dijelaskan lebih lanjut di bagian ini.
Untuk lingkungan IP Pribadi dengan PSC, Anda perlu mengetahui:
- ID jaringan VPC Anda
- ID subnetwork VPC Anda
Dua rentang IP sekunder di subnetwork VPC Anda:
- Rentang IP sekunder untuk pod
- Rentang IP sekunder untuk layanan
Rentang IP untuk komponen lingkungan:
- Rentang IP Bidang Kontrol GKE. Rentang IP untuk bidang kontrol GKE.
- Subjaringan koneksi Cloud Composer. Rentang IP untuk subnetwork koneksi Cloud Composer.
Lingkungan IP pribadi (VPC peering). Dalam konfigurasi ini, lingkungan Anda menggunakan peering VPC untuk konektivitas.
Konfigurasikan lingkungan IP Pribadi Anda:
- Mengonfigurasi jaringan project untuk lingkungan IP Pribadi.
- Tentukan parameter lain untuk lingkungan IP Pribadi Anda, seperti yang dijelaskan lebih lanjut di bagian ini.
Untuk lingkungan IP Pribadi dengan peering VPC, Anda perlu mengetahui:
- ID jaringan VPC Anda
- ID subnetwork VPC Anda
Dua rentang IP sekunder di subnetwork VPC Anda:
- Rentang IP sekunder untuk pod
- Rentang IP sekunder untuk layanan
Rentang IP untuk komponen lingkungan:
Rentang IP untuk bidang kontrol GKE.
Rentang IP untuk peering VPC yang akan diekspor dari jaringan Cloud Composer internal ke jaringan yang dipilih. Komponen infrastruktur Cloud Composer menggunakan alamat IP dari rentang ini.
Rentang IP untuk instance Cloud SQL.
Untuk lingkungan VPC Bersama, Anda harus melakukan penyiapan jaringan tambahan untuk project host, lalu membuat lingkungan IP Publik atau Pribadi di project layanan. Ikuti petunjuk di halaman Mengonfigurasi VPC Bersama.
Untuk lingkungan VPC Bersama, Anda perlu mengetahui:
- ID jaringan VPC project host Anda
ID subjaringan VPC project host Anda
Dua rentang IP sekunder di subnetwork VPC project host Anda:
- Rentang IP sekunder untuk pod
- Rentang IP sekunder untuk layanan
Saat membuat lingkungan VPC Bersama IP Publik, Anda masih perlu menentukan jaringan VPC, subjaringan, dan rentang IP sekunder project host untuk pod dan layanan.
Untuk membuat lingkungan VPC SC, Anda harus membuat perimeter layanan, lalu membuat lingkungan IP Pribadi di dalam perimeter ini. Ikuti petunjuk yang diuraikan dalam artikel Mengonfigurasi Kontrol Layanan VPC.
Opsi jaringan tambahan untuk lingkungan adalah:
- Alamat IP publik yang digunakan secara pribadi. Jika Anda ingin menggunakan lebih banyak alamat IP, lingkungan Anda dapat secara pribadi menggunakan rentang alamat IP publik tertentu sebagai rentang alamat IP subnet internal untuk pod dan layanan.
- Jaringan yang diizinkan. Jika ingin mengakses bidang kontrol lingkungan IP Pribadi menggunakan HTTPS, Anda dapat menggunakan jaringan yang diizinkan untuk menentukan rentang CIDR yang dapat melakukannya.
- Agen Penyamaran IP. Dengan menggunakan lingkungan dengan agen Penyamaran IP, Anda dapat menggunakan terjemahan alamat IP many-to-one dalam konfigurasi jaringan lingkungan. Untuk mengetahui informasi selengkapnya tentang cara membuat lingkungan dengan agen Penyamaran IP, lihat Mengaktifkan agen Penyamaran IP.
Konsol
Untuk membuat lingkungan IP Pribadi:
Pastikan jaringan Anda dikonfigurasi untuk jenis lingkungan yang ingin Anda buat.
Di bagian Konfigurasi jaringan, luaskan item Tampilkan konfigurasi jaringan.
Di menu drop-down Network, pilih ID jaringan VPC Anda.
Di menu drop-down Subnetwork, pilih ID subnetwork VPC Anda.
Di bagian Secondary IP range for pods, pilih atau tentukan rentang IP sekunder untuk pod. Anda dapat menggunakan rentang sekunder yang ada di jaringan VPC, atau memilih untuk menggunakan rentang yang dibuat secara otomatis.
Di bagian Rentang IP sekunder untuk layanan, pilih atau tentukan rentang IP sekunder untuk layanan. Anda dapat menggunakan rentang sekunder yang ada di jaringan VPC, atau memilih untuk menggunakan rentang yang dibuat secara otomatis.
Di bagian Networking type, pilih opsi Private IP environment untuk membuat lingkungan IP Pribadi.
Di bagian Composer connectivity, pilih jenis jaringan untuk lingkungan Anda dan tentukan rentang IP untuk komponen lingkungan:
Untuk lingkungan yang menggunakan Private Service Connect:
Pilih Private Service Connect untuk lingkungan yang menggunakan Private Service Connect.
Di bagian Composer connection subnetwork, tentukan rentang IP untuk subnetwork koneksi Cloud Composer. Alamat untuk endpoint PSC dipilih dari rentang ini. Anda dapat menentukan rentang kustom, atau memilih untuk menggunakan rentang default.
Untuk lingkungan yang menggunakan peering VPC:
Pilih VPC peerings untuk lingkungan yang menggunakan VPC peering.
Di bagian IP range for Composer tenant network, tentukan rentang IP untuk jaringan tenant Cloud Composer. Jaringan ini menghosting komponen proxy SQL lingkungan Anda. Anda dapat menentukan rentang kustom, atau memilih untuk menggunakan rentang default.
Di bagian Rentang IP untuk jaringan Cloud SQL, tentukan rentang IP untuk instance Cloud SQL. Anda dapat menentukan rentang kustom, atau memilih untuk menggunakan rentang default.
Di bagian Rentang IP untuk jaringan bidang kontrol GKE, tentukan rentang IP untuk bidang kontrol GKE:
Untuk menggunakan rentang IP default untuk region tempat lingkungan Anda berada, pilih Rentang IP default.
Untuk menentukan rentang IP kustom, pilih Custom IP range dan masukkan rentang dalam notasi CIDR di kolom GKE cluster master private IP.
Pilih tingkat akses untuk bidang kontrol GKE. Bidang kontrol memiliki dua endpoint. Satu endpoint bersifat pribadi, untuk digunakan oleh VM dan node cluster. Endpoint lainnya bersifat publik. Anda dapat menentukan tingkat akses untuk endpoint publik:
Untuk mengaktifkan akses ke endpoint publik dari jaringan yang diizinkan, centang kotak Akses endpoint bidang kontrol cluster menggunakan alamat IP eksternalnya.
Penggunaan opsi ini akan menetapkan tingkat akses untuk bidang kontrol ke "Akses endpoint publik diaktifkan, jaringan yang diizinkan diaktifkan". Tindakan ini memberikan akses terbatas ke bidang kontrol dari jaringan yang diizinkan. Secara default, tidak ada alamat IP sumber yang ditentukan. Anda dapat menambahkan jaringan yang diizinkan ke cluster.
Untuk menonaktifkan akses ke endpoint publik dari jaringan yang diizinkan, hapus centang pada kotak Akses endpoint bidang kontrol cluster menggunakan alamat IP eksternalnya.
Penggunaan opsi ini akan menetapkan tingkat akses untuk bidang kontrol ke "Akses endpoint publik dinonaktifkan". Tindakan ini mencegah semua akses internet ke bidang kontrol.
gcloud
Pastikan jaringan Anda dikonfigurasi untuk jenis lingkungan yang ingin dibuat.
Saat Anda membuat lingkungan, argumen berikut akan mengontrol parameter jaringan. Jika Anda menghapus parameter, nilai default akan digunakan.
--enable-private-environment
mengaktifkan lingkungan IP Pribadi.--network
menentukan ID jaringan VPC Anda.--subnetwork
menentukan ID subnetwork VPC Anda.--cluster-secondary-range-name
atau--cluster-ipv4-cidr
mengonfigurasi rentang sekunder untuk pod.--services-secondary-range-name
atau--services-ipv4-cidr
untuk mengonfigurasi rentang sekunder untuk layanan.--master-ipv4-cidr
menentukan rentang untuk bidang kontrol GKE.
(Lingkungan dengan PSC)
--connection-subnetwork
menentukan rentang untuk subnetwork koneksi Cloud Composer, yang menghosting endpoint PSC.(Lingkungan dengan peering VPC)
--composer-network-ipv4-cidr
menentukan rentang untuk jaringan tenant Cloud Composer. Jaringan ini menghosting komponen proxy SQL dari lingkungan Anda.(Lingkungan dengan peering VPC)
--cloud-sql-ipv4-cidr
menentukan rentang untuk instance Cloud SQL.
--enable-private-endpoint
mengontrol akses level untuk bidang kontrol GKE. Bidang kontrol memiliki dua endpoint. Satu endpoint bersifat pribadi, untuk digunakan oleh node dan VM cluster. Endpoint lainnya bersifat publik. Anda dapat menentukan tingkat akses untuk endpoint publik:Untuk mengaktifkan akses ke endpoint publik dari jaringan yang diizinkan, hapus argumen
--enable-private-endpoint
.Penggunaan opsi ini akan menetapkan tingkat akses untuk bidang kontrol ke "Akses endpoint publik diaktifkan, jaringan yang diizinkan diaktifkan". Tindakan ini memberikan akses terbatas ke bidang kontrol dari jaringan yang diizinkan. Secara default, tidak ada alamat IP sumber yang ditentukan. Anda dapat menambahkan jaringan yang diizinkan ke cluster.
Untuk menonaktifkan akses ke endpoint publik dari jaringan yang diizinkan, tentukan argumen
--enable-private-endpoint
.Penggunaan opsi ini akan menetapkan tingkat akses untuk bidang kontrol ke "Akses endpoint publik dinonaktifkan". Tindakan ini mencegah semua akses internet ke bidang kontrol.
Argumen
--enable-master-authorized-networks
dan--master-authorized-networks
mengonfigurasi jaringan yang diotorisasi untuk lingkungan Anda.--enable-privately-used-public-ips
mengonfigurasi alamat IP publik yang digunakan secara pribadi untuk lingkungan Anda.--enable-ip-masq-agent
mengaktifkan agen Penyamaran IP.
Contoh (Lingkungan IP pribadi )
gcloud composer environments create ENVIRONMENT_NAME \
--location LOCATION \
--image-version composer-2.9.11-airflow-2.9.3 \
--service-account "SERVICE_ACCOUNT" \
--enable-private-environment \
--network NETWORK_ID \
--subnetwork SUBNETWORK_ID \
--cluster-ipv4-cidr PODS_RANGE \
--services-ipv4-cidr SERVICES_RANGE \
--master-ipv4-cidr CONTROL_PLANE_RANGE \
--connection-subnetwork COMPOSER_PSC_RANGE \
Ganti:
NETWORK_ID
dengan ID jaringan VPC Anda.SUBNETWORK_ID
dengan ID subnetwork VPC Anda.PODS_RANGE
dengan rentang sekunder untuk pod.SERVICES_RANGE
dengan rentang sekunder untuk layanan.CONTROL_PLANE_RANGE
dengan rentang sekunder untuk bidang kontrol GKE.COMPOSER_PSC_RANGE
dengan rentang untuk subnetwork koneksi Cloud Composer.
Langkah 8. (Opsional) Menambahkan tag jaringan
Tag jaringan diterapkan ke semua VM node di cluster lingkungan Anda. Tag digunakan untuk mengidentifikasi sumber atau target yang valid untuk firewall jaringan. Setiap tag dalam daftar harus mematuhi RFC 1035.
Misalnya, Anda mungkin ingin menambahkan tag jaringan jika berencana membatasi traffic untuk lingkungan IP Pribadi dengan aturan firewall.
Konsol
Di halaman Create environment:
- Temukan bagian Konfigurasi jaringan.
- Di kolom Network tags, masukkan tag jaringan untuk lingkungan Anda.
gcloud
Saat Anda membuat lingkungan, argumen berikut akan mengontrol tag jaringan:
--tags
menentukan daftar tag jaringan yang dipisahkan koma yang diterapkan ke semua VM node.
gcloud composer environments create ENVIRONMENT_NAME \
--location LOCATION \
--image-version composer-2.9.11-airflow-2.9.3 \
--service-account "SERVICE_ACCOUNT" \
--tags TAGS
Ganti:
TAGS
dengan daftar tag jaringan yang dipisahkan koma.
Contoh:
gcloud composer environments create example-environment \
--location us-central1 \
--image-version composer-2.9.11-airflow-2.9.3 \
--tags group1,production
API
Saat membuat lingkungan, di resource Environment > EnvironmentConfig, tentukan tag jaringan untuk lingkungan Anda.
{
"name": "projects/PROJECT_ID/locations/LOCATION/environments/ENVIRONMENT_NAME",
"config": {
"nodeConfig": {
"tags": [
"TAG"
],
"serviceAccount": "SERVICE_ACCOUNT"
}
}
}
Ganti:
TAG
dengan tag jaringan.
Contoh:
// POST https://composer.googleapis.com/v1/{parent=projects/*/locations/*}/environments
{
"name": "projects/example-project/locations/us-central1/environments/example-environment",
"config": {
"nodeConfig": {
"tags": [
"group1",
"production"
],
"serviceAccount": "
example-account@example-project.iam.gserviceaccount.com
"
}
}
}
Terraform
Saat Anda membuat lingkungan, kolom berikut menentukan tag jaringan untuk lingkungan Anda:
- Kolom
tags
di bloknode_config
menentukan daftar tag jaringan yang dipisahkan koma yang diterapkan ke semua VM node.
resource "google_composer_environment" "example" {
provider = google-beta
name = "ENVIRONMENT_NAME"
region = "LOCATION"
config {
node_config {
tags = ["TAGS"]
service_account = "SERVICE_ACCOUNT"
}
}
}
Ganti:
TAGS
dengan daftar tag jaringan yang dipisahkan koma.
Contoh:
resource "google_composer_environment" "example" {
provider = google-beta
name = "example-environment"
region = "us-central1"
config {
node_config {
tags = ["group1","production"]
service_account = "
example-account@example-project.iam.gserviceaccount.com
"
}
}
}
Langkah 9. (Opsional) Mengonfigurasi akses jaringan server web
Parameter akses server web Airflow tidak bergantung pada jenis lingkungan Anda. Sebagai gantinya, Anda dapat mengonfigurasi akses server web secara terpisah. Misalnya, lingkungan IP Pribadi masih dapat memiliki UI Airflow yang dapat diakses dari internet.
Anda tidak dapat mengonfigurasi rentang IP yang diizinkan menggunakan alamat IP pribadi.
Konsol
Di halaman Create environment:
Di bagian Konfigurasi jaringan, luaskan item Tampilkan konfigurasi jaringan.
Di bagian Kontrol akses jaringan server web:
Untuk memberikan akses ke server web Airflow dari semua alamat IP, pilih Allow access from all IP addresses.
Untuk membatasi akses hanya ke rentang IP tertentu, pilih Izinkan akses hanya dari alamat IP tertentu. Di kolom IP range, tentukan rentang IP dalam notasi CIDR. Di kolom Deskripsi, tentukan deskripsi opsional untuk rentang ini. Jika Anda ingin menentukan lebih dari satu rentang, klik Tambahkan rentang IP.
Untuk melarang akses untuk semua alamat IP, pilih Izinkan akses hanya dari alamat IP tertentu, lalu klik Hapus item di samping entri rentang kosong.
gcloud
Saat Anda membuat lingkungan, argumen berikut akan mengontrol tingkat akses server web:
--web-server-allow-all
memberikan akses ke Airflow dari semua alamat IP. Opsi ini adalah opsi default.--web-server-allow-ip
hanya membatasi akses ke rentang IP sumber tertentu. Untuk menentukan beberapa rentang IP, gunakan argumen ini beberapa kali.--web-server-deny-all
melarang akses untuk semua alamat IP.
gcloud composer environments create ENVIRONMENT_NAME \
--location LOCATION \
--image-version composer-2.9.11-airflow-2.9.3 \
--web-server-allow-ip ip_range=WS_IP_RANGE,description=WS_RANGE_DESCRIPTION
Ganti:
WS_IP_RANGE
dengan rentang IP, dalam notasi CIDR, yang dapat mengakses UI Airflow.WS_RANGE_DESCRIPTION
dengan deskripsi rentang IP.
Contoh:
gcloud composer environments create example-environment \
--location us-central1 \
--image-version composer-2.9.11-airflow-2.9.3 \
--service-account "
example-account@example-project.iam.gserviceaccount.com
" \
--web-server-allow-ip ip_range=192.0.2.0/24,description="office net 1" \
--web-server-allow-ip ip_range=192.0.4.0/24,description="office net 3"
API
Saat Anda membuat lingkungan, di resource Environment > EnvironmentConfig, tentukan parameter akses server web.
Untuk memberikan akses ke server web Airflow dari semua alamat IP, hapus
webServerNetworkAccessControl
.Untuk membatasi akses hanya ke rentang IP tertentu, tentukan satu atau beberapa rentang di
allowedIpRanges
.Untuk melarang akses ke semua alamat IP, tambahkan
allowedIpRanges
dan jadikan daftar kosong. Jangan tentukan rentang IP di dalamnya.
{
"name": "projects/PROJECT_ID/locations/LOCATION/environments/ENVIRONMENT_NAME",
"config": {
"webServerNetworkAccessControl": {
"allowedIpRanges": [
{
"value": "WS_IP_RANGE",
"description": "WS_RANGE_DESCRIPTION"
}
]
},
"nodeConfig": {
"serviceAccount": "SERVICE_ACCOUNT"
}
}
}
Ganti:
WS_IP_RANGE
dengan rentang IP, dalam notasi CIDR, yang dapat mengakses UI Airflow.WS_RANGE_DESCRIPTION
dengan deskripsi rentang IP.
Contoh:
// POST https://composer.googleapis.com/v1/{parent=projects/*/locations/*}/environments
{
"name": "projects/example-project/locations/us-central1/environments/example-environment",
"config": {
"webServerNetworkAccessControl": {
"allowedIpRanges": [
{
"value": "192.0.2.0/24",
"description": "office net 1"
},
{
"value": "192.0.4.0/24",
"description": "office net 3"
}
]
},
"nodeConfig": {
"serviceAccount": "
example-account@example-project.iam.gserviceaccount.com
"
}
}
}
Terraform
Saat Anda membuat lingkungan, blok allowed_ip_range
di blok web_server_network_access_control
berisi rentang IP yang dapat mengakses server web.
resource "google_composer_environment" "example" {
provider = google-beta
name = "ENVIRONMENT_NAME"
region = "LOCATION"
config {
web_server_network_access_control {
allowed_ip_range {
value = "WS_IP_RANGE"
description = "WS_RANGE_DESCRIPTION"
}
}
node_config {
service_account = "SERVICE_ACCOUNT"
}
}
}
Ganti:
WS_IP_RANGE
dengan rentang IP, dalam notasi CIDR, yang dapat mengakses UI Airflow.WS_RANGE_DESCRIPTION
dengan deskripsi rentang IP.
Contoh:
resource "google_composer_environment" "example" {
provider = google-beta
name = "example-environment"
region = "us-central1"
config {
web_server_network_access_control {
allowed_ip_range {
value = "192.0.2.0/24"
description = "office net 1"
},
allowed_ip_range {
value = "192.0.4.0/24"
description = "office net 3"
}
}
node_config {
service_account = "
example-account@example-project.iam.gserviceaccount.com
"
}
}
Langkah 10. (Opsional) Tentukan penggantian konfigurasi Airflow dan variabel lingkungan
Anda dapat menyiapkan penggantian konfigurasi Airflow dan variabel lingkungan saat membuat lingkungan. Sebagai alternatif, Anda dapat melakukannya nanti, setelah lingkungan dibuat.
Beberapa opsi konfigurasi Airflow diblokir dan Anda tidak dapat menggantinya.
Untuk mengetahui daftar opsi konfigurasi Airflow yang tersedia, lihat Referensi konfigurasi untuk Airflow 2 dan Airflow 1.10.*
Untuk menentukan penggantian konfigurasi Airflow dan variabel lingkungan:
Konsol
Di halaman Create environment:
Di bagian Environment variables, klik Add environment variable.
Masukkan Nama dan Nilai untuk variabel lingkungan.
Di bagian Penggantian konfigurasi Airflow, klik Tambahkan Penggantian konfigurasi Airflow.
Masukkan Section, Key, dan Value untuk penggantian opsi konfigurasi.
Contoh:
Bagian Kunci Nilai webserver
dag_orientation
TB
gcloud
Saat Anda membuat lingkungan, argumen berikut akan mengontrol variabel lingkungan dan penggantian konfigurasi Airflow:
--env-variables
menentukan daftar variabel lingkungan yang dipisahkan koma.Nama variabel dapat berisi huruf besar dan kecil, angka, dan garis bawah, tetapi tidak boleh diawali dengan angka.
--airflow-configs
menentukan daftar kunci dan nilai yang dipisahkan koma untuk penggantian konfigurasi Airflow.
gcloud composer environments create ENVIRONMENT_NAME \
--location LOCATION \
--image-version composer-2.9.11-airflow-2.9.3 \
--service-account "SERVICE_ACCOUNT" \
--env-variables ENV_VARS \
--airflow-configs CONFIG_OVERRIDES
Ganti:
ENV_VARS
dengan daftar pasanganNAME=VALUE
yang dipisahkan koma untuk variabel lingkungan.CONFIG_OVERRIDES
dengan daftar pasanganSECTION-KEY=VALUE
yang dipisahkan koma untuk penggantian konfigurasi. Pisahkan nama bagian konfigurasi dengan simbol-
, diikuti dengan nama kunci. Contoh:core-dags_are_paused_at_creation
.
Contoh:
gcloud composer environments create example-environment \
--location us-central1 \
--image-version composer-2.9.11-airflow-2.9.3 \
--service-account "
example-account@example-project.iam.gserviceaccount.com
" \
--env-variables SENDGRID_MAIL_FROM=user@example.com,SENDGRID_API_KEY=example-key \
--airflow-configs core-dags_are_paused_at_creation=True,webserver-dag_orientation=TB
API
Saat Anda membuat lingkungan, di resource Environment > EnvironmentConfig, tentukan variabel lingkungan dan penggantian konfigurasi Airflow.
{
"name": "projects/PROJECT_ID/locations/LOCATION/environments/ENVIRONMENT_NAME",
"config": {
"softwareConfig": {
"airflowConfigOverrides": {
"SECTION-KEY": "OVERRIDE_VALUE"
},
"envVariables": {
"VAR_NAME": "VAR_VALUE",
}
},
"nodeConfig": {
"serviceAccount": "SERVICE_ACCOUNT"
}
}
}
Ganti:
SECTION
dengan bagian dalam file konfigurasi tempat opsi konfigurasi Airflow berada.KEY
dengan nama opsi konfigurasi Airflow.OVERRIDE_VALUE
dengan nilai opsi konfigurasi Airflow.VAR_NAME
dengan nama variabel lingkungan.VAR_VALUE
dengan nilai variabel lingkungan.
Contoh:
// POST https://composer.googleapis.com/v1/{parent=projects/*/locations/*}/environments
{
"name": "projects/example-project/locations/us-central1/environments/example-environment",
"config": {
"softwareConfig": {
"airflowConfigOverrides": {
"core-dags_are_paused_at_creation": "True",
"webserver-dag_orientation": "TB"
},
"envVariables": {
"SENDGRID_MAIL_FROM": "user@example.com",
"SENDGRID_API_KEY": "example-key"
}
},
"nodeConfig": {
"serviceAccount": "
example-account@example-project.iam.gserviceaccount.com
"
}
}
}
Terraform
Saat Anda membuat lingkungan, blok berikut akan mengontrol variabel lingkungan dan penggantian konfigurasi Airflow:
Blok
env_variables
di bloksoftware_config
menentukan variabel lingkungan.Nama variabel dapat berisi huruf besar dan kecil, angka, dan garis bawah, tetapi tidak boleh diawali dengan angka.
Blok
airflow_config_overrides
di bloksoftware_config
menentukan penggantian konfigurasi Alur Data.
resource "google_composer_environment" "example" {
provider = google-beta
name = "ENVIRONMENT_NAME"
region = "LOCATION"
config {
software_config {
airflow_config_overrides = {
SECTION-KEY = "OVERRIDE_VALUE"
}
env_variables = {
VAR_NAME = "VAR_VALUE"
}
}
node_config {
service_account = "SERVICE_ACCOUNT"
}
}
}
Ganti:
SECTION
dengan bagian dalam file konfigurasi tempat opsi konfigurasi Airflow berada.KEY
dengan nama opsi konfigurasi Airflow.OVERRIDE_VALUE
dengan nilai opsi konfigurasi Airflow.VAR_NAME
dengan nama variabel lingkungan.VAR_VALUE
dengan nilai variabel lingkungan.
Contoh:
resource "google_composer_environment" "example" {
provider = google-beta
name = "example-environment"
region = "us-central1"
config {
software_config {
airflow_config_overrides = {
core-dags_are_paused_at_creation = "True"
webserver-dag_orientation = "TB"
}
env_variables = {
SENDGRID_MAIL_FROM = "user@example.com"
SENDGRID_API_KEY = "example-key"
}
}
node_config {
service_account = "
example-account@example-project.iam.gserviceaccount.com
"
}
}
}
Langkah 11. (Opsional) Tentukan masa pemeliharaan
Periode pemeliharaan default di Cloud Composer 2 adalah dari 00.00.00 hingga 04.00.00 (GMT) pada hari Jumat, Sabtu, dan Minggu setiap minggu.
Untuk menentukan masa pemeliharaan kustom untuk lingkungan Anda:
Konsol
Di halaman Create environment
Temukan bagian Masa pemeliharaan.
Di menu drop-down Zona waktu, pilih zona waktu untuk periode pemeliharaan.
Tetapkan Waktu mulai, Hari, dan Durasi, sehingga waktu gabungan untuk jadwal yang ditentukan minimal 12 jam dalam periode rolling 7 hari. Misalnya, periode 4 jam setiap hari Senin, Rabu, dan Jumat memberikan jumlah waktu yang diperlukan.
gcloud
Argumen berikut menentukan parameter periode pemeliharaan:
--maintenance-window-start
menetapkan waktu mulai masa pemeliharaan.--maintenance-window-end
menetapkan waktu akhir masa pemeliharaan.--maintenance-window-recurrence
menetapkan pengulangan periode pemeliharaan.
gcloud composer environments create ENVIRONMENT_NAME \
--location LOCATION \
--image-version composer-2.9.11-airflow-2.9.3 \
--service-account "SERVICE_ACCOUNT" \
--maintenance-window-start 'DATETIME_START' \
--maintenance-window-end 'DATETIME_END' \
--maintenance-window-recurrence 'MAINTENANCE_RECURRENCE'
Ganti:
ENVIRONMENT_NAME
dengan nama lingkungan.DATETIME_START
dengan tanggal dan waktu mulai dalam format input tanggal/waktu. Hanya waktu hari yang ditentukan yang digunakan, tanggal yang ditentukan akan diabaikan.DATETIME_END
dengan tanggal dan waktu akhir dalam format input tanggal/waktu. Hanya waktu hari yang ditentukan yang digunakan, tanggal yang ditentukan akan diabaikan. Tanggal dan waktu yang ditentukan harus setelah tanggal mulai.MAINTENANCE_RECURRENCE
dengan RRULE RFC 5545 untuk pengulangan masa pemeliharaan. Cloud Composer mendukung dua format:Format
FREQ=DAILY
menentukan pengulangan harian.Format
FREQ=WEEKLY;BYDAY=SU,MO,TU,WE,TH,FR,SA
menentukan pengulangan pada hari dalam seminggu yang dipilih.
Contoh berikut menentukan periode pemeliharaan 6 jam antara pukul 01.00 dan 07.00 (UTC) pada hari Rabu, Sabtu, dan Minggu. Tanggal 1 Januari 2023 akan diabaikan.
gcloud composer environments create example-environment \
--location us-central1 \
--image-version composer-2.9.11-airflow-2.9.3 \
--service-account "
example-account@example-project.iam.gserviceaccount.com
" \
--maintenance-window-start '2023-01-01T01:00:00Z' \
--maintenance-window-end '2023-01-01T07:00:00Z' \
--maintenance-window-recurrence 'FREQ=WEEKLY;BYDAY=SU,WE,SA'
API
Saat Anda membuat lingkungan, di resource Environment > EnvironmentConfig, tentukan parameter periode pemeliharaan:
{
"name": "projects/PROJECT_ID/locations/LOCATION/environments/ENVIRONMENT_NAME",
"config": {
"maintenanceWindow": {
"startTime": "DATETIME_START",
"endTime": "DATETIME_END",
"recurrence": "MAINTENANCE_RECURRENCE"
},
"nodeConfig": {
"serviceAccount": "SERVICE_ACCOUNT"
}
}
}
Ganti:
DATETIME_START
dengan tanggal dan waktu mulai dalam format input tanggal/waktu. Hanya waktu yang ditentukan yang digunakan, tanggal yang ditentukan akan diabaikan.DATETIME_END
dengan tanggal dan waktu akhir dalam format input tanggal/waktu. Hanya waktu yang ditentukan yang digunakan, tanggal yang ditentukan akan diabaikan. Tanggal dan waktu yang ditentukan harus setelah tanggal mulai.MAINTENANCE_RECURRENCE
dengan RRULE RFC 5545 untuk pengulangan masa pemeliharaan. Cloud Composer mendukung dua format:Format
FREQ=DAILY
menentukan pengulangan harian.Format
FREQ=WEEKLY;BYDAY=SU,MO,TU,WE,TH,FR,SA
menentukan pengulangan pada hari dalam seminggu yang dipilih.
Contoh berikut menentukan periode pemeliharaan 6 jam antara pukul 01.00 dan 07.00 (UTC) pada hari Rabu, Sabtu, dan Minggu. Tanggal 1 Januari 2023 akan diabaikan.
Contoh:
// POST https://composer.googleapis.com/v1/{parent=projects/*/locations/*}/environments
{
"name": "projects/example-project/locations/us-central1/environments/example-environment",
"config": {
"maintenanceWindow": {
"startTime": "2023-01-01T01:00:00Z",
"endTime": "2023-01-01T07:00:00Z",
"recurrence": "FREQ=WEEKLY;BYDAY=SU,WE,SA"
},
"nodeConfig": {
"serviceAccount": "SERVICE_ACCOUNT"
}
}
}
Terraform
Blok maintenance_window
menentukan periode pemeliharaan untuk lingkungan Anda:
resource "google_composer_environment" "example" {
provider = google-beta
name = "ENVIRONMENT_NAME"
region = "LOCATION"
config {
maintenance_window {
start_time = "DATETIME_START"
end_time = "DATETIME_END"
recurrence = "MAINTENANCE_RECURRENCE"
}
node_config {
service_account = "SERVICE_ACCOUNT"
}
}
}
Ganti:
DATETIME_START
dengan tanggal dan waktu mulai dalam format input tanggal/waktu. Hanya waktu yang ditentukan yang digunakan, tanggal yang ditentukan akan diabaikan.DATETIME_END
dengan tanggal dan waktu akhir dalam format input tanggal/waktu. Hanya waktu yang ditentukan yang digunakan, tanggal yang ditentukan akan diabaikan. Tanggal dan waktu yang ditentukan harus setelah tanggal mulai.MAINTENANCE_RECURRENCE
dengan RRULE RFC 5545 untuk pengulangan masa pemeliharaan. Cloud Composer mendukung dua format:- Format
FREQ=DAILY
menentukan pengulangan harian. - Format
FREQ=WEEKLY;BYDAY=SU,MO,TU,WE,TH,FR,SA
menentukan pengulangan pada hari dalam seminggu yang dipilih.
- Format
Contoh berikut menentukan periode pemeliharaan 6 jam antara pukul 01.00 dan 07.00 (UTC) pada hari Rabu, Sabtu, dan Minggu. Tanggal 1 Januari 2023 akan diabaikan.
resource "google_composer_environment" "example" {
provider = google-beta
name = "example-environment"
region = "us-central1"
config {
maintenance_window {
start_time = "2023-01-01T01:00:00Z"
end_time = "2023-01-01T07:00:00Z"
recurrence = "FREQ=WEEKLY;BYDAY=SU,WE,SA"
}
}
}
Langkah 12. (Opsional) Integrasi garis keturunan data
Silsilah data adalah fitur Dataplex yang memungkinkan Anda melacak pergerakan data.
Integrasi garis keturunan data tersedia di Cloud Composer 2 versi 2.1.2 dan yang lebih baru dengan Airflow versi 2.2.5 dan yang lebih baru.Integrasi silsilah data otomatis diaktifkan di lingkungan Cloud Composer baru jika kondisi berikut terpenuhi:
Data Lineage API diaktifkan di project Anda. Untuk informasi selengkapnya, lihat Mengaktifkan Data Lineage API dalam dokumentasi Dataplex.
Lineage Backend kustom tidak dikonfigurasi di Airflow.
Anda dapat menonaktifkan integrasi silsilah data saat membuat lingkungan. Misalnya, jika Anda ingin mengganti perilaku otomatis atau memilih untuk mengaktifkan silsilah data nanti, setelah lingkungan dibuat.
Konsol
Untuk menonaktifkan integrasi Linimasa data, di halaman Create environment:
Di bagian Konfigurasi lanjutan, luaskan item Tampilkan konfigurasi lanjutan.
Di bagian Integrasi silsilah data Dataplex, pilih Nonaktifkan integrasi dengan silsilah data Dataplex.
gcloud
Saat Anda membuat lingkungan, argumen --disable-cloud-data-lineage-integration
akan menonaktifkan integrasi garis keturunan data.
gcloud composer environments create ENVIRONMENT_NAME \
--location LOCATION \
--image-version composer-2.9.11-airflow-2.9.3 \
--service-account "SERVICE_ACCOUNT" \
--disable-cloud-data-lineage-integration
Ganti:
ENVIRONMENT_NAME
dengan nama lingkungan.LOCATION
dengan region tempat lingkungan tersebut berada.
Contoh:
gcloud composer environments create example-environment \
--location us-central1 \
--image-version composer-2.9.11-airflow-2.9.3 \
--service-account "
example-account@example-project.iam.gserviceaccount.com
" \
--disable-cloud-data-lineage-integration
Langkah 13. (Opsional) Mengonfigurasi enkripsi data (CMEK)
Secara default, data di lingkungan Anda dienkripsi dengan kunci yang disediakan oleh Google.
Untuk menggunakan kunci enkripsi yang dikelola pelanggan (CMEK) guna mengenkripsi data di lingkungan Anda, ikuti petunjuk yang diuraikan dalam Menggunakan kunci enkripsi yang dikelola pelanggan.
Langkah 14. (Opsional) Menggunakan bucket lingkungan kustom
Saat Anda membuat lingkungan, Cloud Composer akan otomatis membuat bucket untuk lingkungan Anda.
Sebagai alternatif, Anda dapat menentukan bucket Cloud Storage kustom dari project Anda. Lingkungan Anda menggunakan bucket ini dengan cara yang sama seperti bucket yang dibuat secara otomatis.
Untuk menggunakan bucket lingkungan kustom, ikuti petunjuk yang diuraikan dalam Menggunakan bucket lingkungan kustom.
Langkah 15. (Opsional) Menentukan label lingkungan
Anda dapat menetapkan label ke lingkungan untuk mengelompokkan biaya penagihan berdasarkan label ini.
Konsol
Di halaman Create environment, di bagian Labels:
Klik Tambahkan label.
Di kolom Key dan Value, tentukan pasangan kunci dan nilai untuk label lingkungan.
gcloud
Saat Anda membuat lingkungan, argumen --labels
menentukan daftar kunci dan nilai yang dipisahkan koma dengan label lingkungan.
gcloud composer environments create ENVIRONMENT_NAME \
--location LOCATION \
--image-version composer-2.9.11-airflow-2.9.3 \
--service-account "SERVICE_ACCOUNT" \
--labels LABELS
Ganti:
LABELS
dengan daftar pasanganKEY=VALUE
yang dipisahkan koma untuk label lingkungan.
Contoh:
gcloud composer environments create example-environment \
--location us-central1 \
--image-version composer-2.9.11-airflow-2.9.3 \
--service-account "
example-account@example-project.iam.gserviceaccount.com
" \
--labels owner=engineering-team,env=production
API
Saat membuat lingkungan, di resource Environment, tentukan label untuk lingkungan Anda.
{
"name": "projects/PROJECT_ID/locations/LOCATION/environments/ENVIRONMENT_NAME",
"labels": {
"LABEL_KEY": "LABEL_VALUE"
}
}
Ganti:
LABEL_KEY
dengan kunci label lingkungan.LABEL_VALUE
dengan nilai label lingkungan.
Contoh:
// POST https://composer.googleapis.com/v1/{parent=projects/*/locations/*}/environments
{
"name": "projects/example-project/locations/us-central1/environments/example-environment",
"labels": {
"owner": "engineering-team",
"env": "production"
}
}
Terraform
Saat membuat lingkungan, tentukan label di blok labels
(di luar blok config
).
resource "google_composer_environment" "example" {
provider = google-beta
name = "ENVIRONMENT_NAME"
region = "LOCATION"
labels = {
LABEL_KEY = "LABEL_VALUE"
}
}
Ganti:
LABEL_KEY
dengan kunci label lingkungan.LABEL_VALUE
dengan nilai label lingkungan.
Contoh:
resource "google_composer_environment" "example" {
provider = google-beta
name = "example-environment"
region = "us-central1"
labels = {
owner = "engineering-team"
env = "production"
}
}
Langkah selanjutnya
- Memecahkan masalah pembuatan lingkungan
- Mengonfigurasi VPC Bersama
- Mengonfigurasi Kontrol Layanan VPC
- Menambahkan dan memperbarui DAG
- Mengakses UI Airflow
- Memperbarui dan menghapus lingkungan
- Tentang versi Cloud Composer