Menjalankan DAG Apache Airflow di Cloud Composer 3
Cloud Composer 1 | Cloud Composer 2 | Cloud Composer 3
Panduan memulai ini menunjukkan cara membuat lingkungan Cloud Composer dan menjalankan DAG Apache Airflow di Cloud Composer 3.
Jika Anda baru menggunakan Airflow, lihat Tutorial konsep Airflow di Apache Airflow untuk informasi lebih lanjut tentang konsep Airflow, objek, dan penggunaannya.
Jika Anda ingin menggunakan Google Cloud CLI, lihat Menjalankan DAG Apache Airflow di Cloud Composer (Google Cloud CLI).
Jika Anda ingin membuat lingkungan menggunakan Terraform, lihat Membuat lingkungan (Terraform).
Sebelum memulai
- Login ke akun Google Cloud Anda. Jika Anda baru menggunakan Google Cloud, buat akun untuk mengevaluasi performa produk kami dalam skenario dunia nyata. Pelanggan baru juga mendapatkan kredit gratis senilai $300 untuk menjalankan, menguji, dan men-deploy workload.
-
Di konsol Google Cloud, pada halaman pemilih project, pilih atau buat project Google Cloud.
-
Pastikan penagihan telah diaktifkan untuk project Google Cloud Anda.
-
Di konsol Google Cloud, pada halaman pemilih project, pilih atau buat project Google Cloud.
-
Pastikan penagihan telah diaktifkan untuk project Google Cloud Anda.
-
Aktifkan API Cloud Composer.
-
Untuk mendapatkan izin yang diperlukan dalam menyelesaikan panduan memulai ini, minta administrator untuk memberi Anda peran IAM berikut pada project Anda:
-
Untuk melihat dan mengelola lingkungan Cloud Composer:
-
Administrator Objek Lingkungan dan Penyimpanan (
roles/composer.environmentAndStorageObjectAdmin
) -
Service Account User (
roles/iam.serviceAccountUser
)
-
Administrator Objek Lingkungan dan Penyimpanan (
-
Untuk melihat log:
Logs Viewer (
roles/logging.viewer
)
Untuk mengetahui informasi selengkapnya tentang cara memberikan peran, lihat Mengelola akses ke project, folder, dan organisasi.
Anda mungkin juga bisa mendapatkan izin yang diperlukan melalui perintah peran atau setelan standar lainnya peran tertentu.
-
Untuk melihat dan mengelola lingkungan Cloud Composer:
Membuat lingkungan
Di konsol Google Cloud, buka halaman Create environment.
Di kolom Name, masukkan
example-environment
.Di menu drop-down Lokasi, pilih wilayah untuk lingkungan Cloud Composer. Panduan ini menggunakan region
us-central1
.Untuk opsi konfigurasi lingkungan lainnya, gunakan setelan default yang disediakan.
Klik Create dan tunggu hingga lingkungan dibuat.
Setelah selesai, tanda centang hijau akan ditampilkan di samping nama lingkungan.
Membuat file DAG
DAG Airflow adalah kumpulan tugas terorganisir yang yang ingin Anda jadwalkan dan jalankan. DAG ditentukan dalam file Python standar.
Panduan ini menggunakan contoh DAG Airflow yang ditentukan dalam file quickstart.py
.
Kode Python dalam file ini melakukan hal berikut:
- Membuat DAG,
composer_sample_dag
. DAG ini berjalan setiap hari. - Menjalankan satu tugas,
print_dag_run_conf
. Tugas ini mencetak proses DAG konfigurasinya dengan menggunakan operator {i>bash<i}.
Simpan salinan file quickstart.py
di komputer lokal Anda:
Mengupload file DAG ke bucket lingkungan Anda
Setiap lingkungan Cloud Composer memiliki Cloud Storage
yang terkait dengannya. Airflow di Cloud Composer hanya menjadwalkan DAG yang berada di folder /dags
di bucket ini.
Untuk menjadwalkan DAG, upload quickstart.py
dari komputer lokal Anda ke
folder /dags
lingkungan:
Di Konsol Google Cloud, buka halaman Environments.
Dalam daftar lingkungan, klik nama lingkungan Anda,
example-environment
. Halaman Detail lingkungan akan terbuka.Klik Open DAGs folder. Halaman Bucket details akan terbuka.
Klik Upload files lalu pilih salinan
quickstart.py
.Untuk mengupload file, klik Open.
Melihat DAG
Setelah Anda mengupload file DAG, Airflow akan melakukan hal berikut:
- Mengurai file DAG yang Anda upload. Mungkin perlu waktu beberapa menit hingga DAG tersedia untuk Airflow.
- Menambahkan DAG ke daftar DAG yang tersedia.
- Mengeksekusi DAG sesuai dengan jadwal yang Anda berikan di file DAG.
Pastikan DAG Anda diproses tanpa error dan tersedia di Airflow dengan melihatnya di UI DAG. UI DAG adalah antarmuka Cloud Composer untuk melihat Informasi DAG di Konsol Google Cloud. Cloud Composer juga menyediakan akses ke UI Airflow, yang merupakan antarmuka web Airflow native.
Tunggu sekitar lima menit guna memberi Airflow waktu untuk memproses file DAG yang telah Anda upload sebelumnya, dan untuk menyelesaikan DAG pertama, (akan dijelaskan nanti).
Di Konsol Google Cloud, buka halaman Environments.
Dalam daftar lingkungan, klik nama lingkungan Anda,
example-environment
. Halaman Detail lingkungan akan terbuka.Buka tab DAGs.
Memastikan DAG
composer_quickstart
ada dalam daftar DAG.
Melihat detail operasi DAG
Satu eksekusi DAG disebut eksekusi DAG. Aliran udara segera menjalankan DAG untuk contoh DAG karena tanggal mulai di file DAG adalah ditetapkan ke kemarin. Dengan cara ini, Airflow akan mengejar jadwal proyek.
Contoh DAG berisi satu tugas, print_dag_run_conf
, yang menjalankan echo
di konsol. Perintah ini menghasilkan informasi meta tentang DAG
(ID numerik operasi DAG).
Di tab DAGs, klik
composer_quickstart
. Tab Runs untuk DAG akan terbuka.Dalam daftar operasi DAG, klik entri pertama.
Detail proses DAG ditampilkan, yang memerinci informasi tentang pada contoh DAG.
Bagian Logs for DAG run mencantumkan log untuk semua tugas di DAG yang dijalankan. Anda dapat melihat output perintah
echo
di log.
Pembersihan
Agar tidak menimbulkan biaya pada akun Google Cloud Anda untuk resource yang digunakan pada halaman ini, ikuti langkah-langkah berikut.
Hapus resource yang digunakan dalam tutorial ini:
Hapus lingkungan Cloud Composer:
Di Konsol Google Cloud, buka halaman Environments.
Pilih
example-environment
, lalu klik Hapus.Tunggu hingga lingkungan dihapus.
Hapus bucket lingkungan Anda. Menghapus Cloud Composer tidak akan menghapus bucket-nya.
Di Konsol Google Cloud, buka Storage > Browser.
Pilih bucket lingkungan dan klik Delete. Misalnya, bucket dapat diberi nama
us-central1-example-environ-c1616fe8-bucket
.
Hapus persistent disk dari antrean Redis lingkungan Anda. Menghapus Lingkungan Cloud Composer tidak menghapus persistent disk-nya.
Di konsol Google Cloud, buka Compute Engine > Disks.
Pilih persistent disk antrean Redis lingkungan lingkungan Anda dan klik Hapus.
Misalnya, {i>disk<i} ini dapat diberi nama
gke-us-central1-exampl-pvc-b12055b6-c92c-43ff-9de9-10f2cc6fc0ee
. Disk untuk Cloud Composer 1 selalu memilikiStandard persistent disk
jenis dan ukuran 2 GB.
Langkah selanjutnya